Mam skrypt, który musi wykonać pewne czynności w oparciu o daty utworzenia i modyfikacji pliku, ale musi działać w systemach Linux i Windows .
Jaki jest najlepszy międzyplatformowy sposób na tworzenie i modyfikowanie plików date/timesw Pythonie ?
Mam skrypt, który musi wykonać pewne czynności w oparciu o daty utworzenia i modyfikacji pliku, ale musi działać w systemach Linux i Windows .
Jaki jest najlepszy międzyplatformowy sposób na tworzenie i modyfikowanie plików date/timesw Pythonie ?
Odpowiedzi:
Uzyskiwanie jakiejś daty modyfikacji na wiele platform jest łatwe - wystarczy zadzwonić, a otrzymasz uniksowy znacznik czasu, kiedy plik był ostatnio modyfikowany.os.path.getmtime(path)path
Z drugiej strony, uzyskiwanie dat utworzenia plików jest skomplikowane i zależne od platformy, różni się nawet między trzema dużymi systemami operacyjnymi:
ctime(udokumentowany na stronie https://msdn.microsoft.com/en-us/library/14h5k7ff.aspx ) przechowuje datę jego utworzenia. Możesz uzyskać do tego dostęp w Pythonie poprzez os.path.getctime()lub .st_ctimeatrybut wyniku połączenia z os.stat(). To nie zadziała w systemie Unix, gdzie ctime ostatni raz zmieniono atrybuty lub zawartość pliku ..st_birthtimeatrybutu wyniku połączenia z os.stat().W Linuksie jest to obecnie niemożliwe, przynajmniej bez napisania rozszerzenia C dla Pythona. Chociaż niektóre systemy plików powszechnie używane w systemie Linux przechowują daty utworzenia (na przykład ext4przechowują je w st_crtime), jądro Linuksa nie oferuje dostępu do nich ; w szczególności struktury zwracane przez stat()wywołania w C, od najnowszej wersji jądra, nie zawierają żadnych pól daty utworzenia . Możesz również zobaczyć, że identyfikator st_crtimeobecnie nie występuje nigdzie w źródle Pythona . Przynajmniej jeśli jesteś włączony ext4, dane są dołączane do i-węzłów w systemie plików, ale nie ma wygodnego sposobu dostępu do nich.
Kolejną najlepszą rzeczą w Linuksie jest dostęp do pliku za mtimepośrednictwem jednego os.path.getmtime()z .st_mtimeatrybutów os.stat()wyniku. To da ci ostatnią modyfikację zawartości pliku, co może być odpowiednie w niektórych przypadkach użycia.
Podsumowując, kod dla wielu platform powinien wyglądać mniej więcej tak ...
import os
import platform
def creation_date(path_to_file):
"""
Try to get the date that a file was created, falling back to when it was
last modified if that isn't possible.
See http://stackoverflow.com/a/39501288/1709587 for explanation.
"""
if platform.system() == 'Windows':
return os.path.getctime(path_to_file)
else:
stat = os.stat(path_to_file)
try:
return stat.st_birthtime
except AttributeError:
# We're probably on Linux. No easy way to get creation dates here,
# so we'll settle for when its content was last modified.
return stat.st_mtime
ext4dyskach pod Linuksem i chciałbym dowiedzieć się, co się dzieje, gdy Linux odczytuje pliki napisane przez Windows lub odwrotnie, biorąc pod uwagę, że używają one st_ctimeinaczej.
"w", nie zastępuje go, po prostu otwiera istniejący plik i obcina go. Mimo że zawartość pliku jest całkowicie niezwiązana z tym, co miał podczas tworzenia, nadal można powiedzieć, że plik został „utworzony” na długo przed bieżącą wersją. I na odwrót, redaktorzy używający zamiany atomowej podczas zapisywania (oryginalny plik jest zastępowany nowym plikiem tymczasowym w toku) wyświetlałby późniejszą datę utworzenia, nawet jeśli usunąłeś tylko jeden znak. Użyj czasu modyfikacji, nie puszczaj gruba na czas tworzenia.
stat.st_ctimejest bardziej istotne, ponieważ w wielu przypadkach czasem ostatniej zmiany metadanych może być czas utworzenia (przynajmniej ctimebliższy rzeczywistemu czasowi tworzenia niż mtime). Dlatego możesz po prostu zastąpić swój fragment stat = os.stat(path_to_file); try: return stat.st_birthtime; except AttributeError: return stat.st_ctime. Co myślisz? Pozdrawiam
ctimezawsze powinien być równy lub później niż mtime, ponieważ mtimezmiana powoduje to ctimezmianę (bo mtimesam jest uważany za „metadane”). Zobacz stackoverflow.com/a/39521489/1709587, gdzie podam przykładowy kod ilustrujący to.
Masz kilka możliwości. Po pierwsze możesz użyć funkcji os.path.getmtimei os.path.getctime:
import os.path, time
print("last modified: %s" % time.ctime(os.path.getmtime(file)))
print("created: %s" % time.ctime(os.path.getctime(file)))
Inną opcją jest użycie os.stat:
import os, time
(mode, ino, dev, nlink, uid, gid, size, atime, mtime, ctime) = os.stat(file)
print("last modified: %s" % time.ctime(mtime))
Uwaga : ctime()nie nie odnoszą się do czasu utworzenia na systemów uniksowych, ale raczej ostatni raz dane iwęzłów zmieniło. (podziękowania dla kojiro za wyjaśnienie tego faktu w komentarzach poprzez podanie linku do interesującego posta na blogu)
ctimezostanie zaktualizowany, gdy mtimerobi (ponieważ mtimejest „metadane”), a więc ctimejest zwykle zawsze równa lub przedmtime . Traktowanie ctimejak czas „stworzony” nie ma zatem żadnego sensu. -1!
Last modified: Fri Jan 31 11:08:13 2020i Created: Fri Jan 31 11:08:13 2020na Linux Ubuntu 16.04!
time.ctime(os.path.getmtime(file))zwraca 2 typy ciągów, w zależności od tego, czy plik został zmodyfikowany przez system, czy przez użytkownika. Jeśli został zmodyfikowany przez system, łańcuch będzie zawierał 2 spacje między miesiącem a dniem. Nie wiem dlaczego
Najlepszą funkcją do tego celu jest os.path.getmtime () . To po prostu wykorzystuje os.stat(filename).st_mtime.
Moduł datetime jest najlepszym manipulowaniem znacznikami czasu, więc datę modyfikacji można uzyskać jako datetimeobiekt taki jak ten:
import os
import datetime
def modification_date(filename):
t = os.path.getmtime(filename)
return datetime.datetime.fromtimestamp(t)
Przykład użycia:
>>> d = modification_date('/var/log/syslog')
>>> print d
2009-10-06 10:50:01
>>> print repr(d)
datetime.datetime(2009, 10, 6, 10, 50, 1)
getmtimejest najbliższą rzeczą dostępną w systemie Unix (gdzie uzyskanie dat utworzenia nie jest możliwe), ale zdecydowanie nie jest najlepszą funkcją do użycia w systemie Windows, gdzie ctimejest czas utworzenia.
os.stat https://docs.python.org/2/library/stat.html#module-stat
edit: W nowszym kodzie powinieneś prawdopodobnie użyć os.path.getmtime () (dzięki Christian Oudard),
ale zwróć uwagę, że zwraca zmiennoprzecinkową wartość time_t z ułamkiem sekund (jeśli twój system to obsługuje)
os.path.getmtime()istnieje od czasu wydania Python 1.5.2 (patrz stare dokumenty ), wydanego zanim straciłem większość zębów mlecznych i prawie dekadę przed napisaniem oryginalnej wersji tej odpowiedzi.
Istnieją dwie metody uzyskania czasu mod, os.path.getmtime () lub os.stat (), ale ctime nie jest wiarygodny na różnych platformach (patrz poniżej).
getmtime ( ścieżka )
Zwraca czas ostatniej modyfikacji ścieżki. Wartość zwracana to liczba podająca liczbę sekund od epoki (patrz moduł czasu). Podnieś os.error, jeśli plik nie istnieje lub jest niedostępny. Nowości w wersji 1.5.2. Zmieniono w wersji 2.3: Jeśli os.stat_float_times () zwraca True, wynikiem jest liczba zmiennoprzecinkowa.
stat ( ścieżka )
Wykonaj wywołanie systemowe stat () na podanej ścieżce. Zwracana wartość to obiekt, którego atrybuty odpowiadają elementom struktury statystyki, a mianowicie: st_mode (bity ochronne), st_ino (numer i-węzła), st_dev (urządzenie), st_nlink (liczba twardych dowiązań), st_uid (identyfikator użytkownika właściciela ), st_gid (identyfikator grupy właściciela), st_size (rozmiar pliku, w bajtach), st_atime (czas ostatniego dostępu), st_mtime (czas ostatniej modyfikacji treści), st_ctime (zależny od platformy; czas ostatniej zmiany metadanych w systemie Unix lub czas utworzenia w systemie Windows) :
>>> import os
>>> statinfo = os.stat('somefile.txt')
>>> statinfo
(33188, 422511L, 769L, 1, 1032, 100, 926L, 1105022698,1105022732, 1105022732)
>>> statinfo.st_size
926L
>>>
W powyższym przykładzie użyjesz statinfo.st_mtime lub statinfo.st_ctime, aby uzyskać odpowiednio mtime i ctime.
W Pythonie 3.4 i nowszych można użyć zorientowanego obiektowo interfejsu modułu pathlib , który zawiera opakowania dla większości modułów systemu operacyjnego . Oto przykład pobierania statystyk plików.
>>> import pathlib
>>> fname = pathlib.Path('test.py')
>>> assert fname.exists(), f'No such file: {fname}' # check that the file exists
>>> print(fname.stat())
os.stat_result(st_mode=33206, st_ino=5066549581564298, st_dev=573948050, st_nlink=1, st_uid=0, st_gid=0, st_size=413, st_atime=1523480272, st_mtime=1539787740, st_ctime=1523480272)
Aby uzyskać więcej informacji o tym os.stat_result, co zawiera, zapoznaj się z dokumentacją . Dla potrzebnego czasu modyfikacji fname.stat().st_mtime:
>>> import datetime
>>> mtime = datetime.datetime.fromtimestamp(fname.stat().st_mtime)
>>> print(mtime)
datetime.datetime(2018, 10, 17, 10, 49, 0, 249980)
Jeśli chcesz czas utworzenia w systemie Windows lub najnowszą zmianę metadanych w systemie Unix, możesz użyć fname.stat().st_ctime:
>>> ctime = datetime.datetime.fromtimestamp(fname.stat().st_ctime)
>>> print(ctime)
datetime.datetime(2018, 4, 11, 16, 57, 52, 151953)
Ten artykuł zawiera bardziej pomocne informacje i przykłady dotyczące modułu pathlib.
os.statzwraca nazwaną krotkę z atrybutami st_mtimei st_ctime. Czas modyfikacji jest st_mtimena obu platformach; niestety w systemie Windows ctimeoznacza „czas utworzenia”, podczas gdy w systemie POSIX oznacza „czas zmiany”. Nie znam żadnego sposobu na uzyskanie czasu tworzenia na platformach POSIX.
dir(..)jednego. Np.dir(os.stat(os.listdir('.')[0]))
import os, time, datetime
file = "somefile.txt"
print(file)
print("Modified")
print(os.stat(file)[-2])
print(os.stat(file).st_mtime)
print(os.path.getmtime(file))
print()
print("Created")
print(os.stat(file)[-1])
print(os.stat(file).st_ctime)
print(os.path.getctime(file))
print()
modified = os.path.getmtime(file)
print("Date modified: "+time.ctime(modified))
print("Date modified:",datetime.datetime.fromtimestamp(modified))
year,month,day,hour,minute,second=time.localtime(modified)[:-3]
print("Date modified: %02d/%02d/%d %02d:%02d:%02d"%(day,month,year,hour,minute,second))
print()
created = os.path.getctime(file)
print("Date created: "+time.ctime(created))
print("Date created:",datetime.datetime.fromtimestamp(created))
year,month,day,hour,minute,second=time.localtime(created)[:-3]
print("Date created: %02d/%02d/%d %02d:%02d:%02d"%(day,month,year,hour,minute,second))
odciski
somefile.txt
Modified
1429613446
1429613446.0
1429613446.0
Created
1517491049
1517491049.28306
1517491049.28306
Date modified: Tue Apr 21 11:50:46 2015
Date modified: 2015-04-21 11:50:46
Date modified: 21/04/2015 11:50:46
Date created: Thu Feb 1 13:17:29 2018
Date created: 2018-02-01 13:17:29.283060
Date created: 01/02/2018 13:17:29
>>> import os
>>> os.stat('feedparser.py').st_mtime
1136961142.0
>>> os.stat('feedparser.py').st_ctime
1222664012.233
>>>
Jeśli podążanie za dowiązaniami symbolicznymi nie jest ważne, możesz również użyć os.lstatwbudowanego.
>>> os.lstat("2048.py")
posix.stat_result(st_mode=33188, st_ino=4172202, st_dev=16777218L, st_nlink=1, st_uid=501, st_gid=20, st_size=2078, st_atime=1423378041, st_mtime=1423377552, st_ctime=1423377553)
>>> os.lstat("2048.py").st_atime
1423378041.0
Warto spojrzeć na crtimebibliotekę, która implementuje międzyplatformowy dostęp do czasu tworzenia pliku.
from crtime import get_crtimes_in_dir
for fname, date in get_crtimes_in_dir(".", raise_on_error=True, as_epoch=False):
print(fname, date)
# file_a.py Mon Mar 18 20:51:18 CET 2019
debugfsw Linuksie, który z definicji jest niestabilny, wymaga dostępu do konta root na najwyższym poziomie i praktycznie w każdym aspekcie jest jedną z rzeczy, o których zawsze ostrzegała cię twoja matka. (Ale tak, to prawdopodobnie działa, jeśli naprawdę jesteś zdesperowany i zdarza ci się być prawdziwym superużytkownikiem w systemie bez bezpiecznego rozruchu…)
os.statobejmuje czas utworzenia. Po prostu nie ma definicji st_anything dla elementu, os.stat()który zawiera czas.
Spróbuj tego:
os.stat('feedparser.py')[8]
Porównaj to ze swoją datą utworzenia w pliku w ls -lah
Powinny być takie same.
Byłem w stanie uzyskać czas tworzenia na posix, uruchamiając komendę systemową statystyki i analizując dane wyjściowe.
commands.getoutput('stat FILENAME').split('\"')[7]
Uruchomienie statystyki poza pythonem z terminala (OS X) zwróciło:
805306374 3382786932 -rwx------ 1 km staff 0 1098083 "Aug 29 12:02:05 2013" "Aug 29 12:02:05 2013" "Aug 29 12:02:20 2013" "Aug 27 12:35:28 2013" 61440 2150 0 testfile.txt
... gdzie czwartym czasem danych jest tworzenie pliku (zamiast czasu zmiany ctime, jak zauważono w innych komentarzach).