Mam skrypt, który musi wykonać pewne czynności w oparciu o daty utworzenia i modyfikacji pliku, ale musi działać w systemach Linux i Windows .
Jaki jest najlepszy międzyplatformowy sposób na tworzenie i modyfikowanie plików date/times
w Pythonie ?
Mam skrypt, który musi wykonać pewne czynności w oparciu o daty utworzenia i modyfikacji pliku, ale musi działać w systemach Linux i Windows .
Jaki jest najlepszy międzyplatformowy sposób na tworzenie i modyfikowanie plików date/times
w Pythonie ?
Odpowiedzi:
Uzyskiwanie jakiejś daty modyfikacji na wiele platform jest łatwe - wystarczy zadzwonić, a otrzymasz uniksowy znacznik czasu, kiedy plik był ostatnio modyfikowany.os.path.getmtime(path)
path
Z drugiej strony, uzyskiwanie dat utworzenia plików jest skomplikowane i zależne od platformy, różni się nawet między trzema dużymi systemami operacyjnymi:
ctime
(udokumentowany na stronie https://msdn.microsoft.com/en-us/library/14h5k7ff.aspx ) przechowuje datę jego utworzenia. Możesz uzyskać do tego dostęp w Pythonie poprzez os.path.getctime()
lub .st_ctime
atrybut wyniku połączenia z os.stat()
. To nie zadziała w systemie Unix, gdzie ctime
ostatni raz zmieniono atrybuty lub zawartość pliku ..st_birthtime
atrybutu wyniku połączenia z os.stat()
.W Linuksie jest to obecnie niemożliwe, przynajmniej bez napisania rozszerzenia C dla Pythona. Chociaż niektóre systemy plików powszechnie używane w systemie Linux przechowują daty utworzenia (na przykład ext4
przechowują je w st_crtime
), jądro Linuksa nie oferuje dostępu do nich ; w szczególności struktury zwracane przez stat()
wywołania w C, od najnowszej wersji jądra, nie zawierają żadnych pól daty utworzenia . Możesz również zobaczyć, że identyfikator st_crtime
obecnie nie występuje nigdzie w źródle Pythona . Przynajmniej jeśli jesteś włączony ext4
, dane są dołączane do i-węzłów w systemie plików, ale nie ma wygodnego sposobu dostępu do nich.
Kolejną najlepszą rzeczą w Linuksie jest dostęp do pliku za mtime
pośrednictwem jednego os.path.getmtime()
z .st_mtime
atrybutów os.stat()
wyniku. To da ci ostatnią modyfikację zawartości pliku, co może być odpowiednie w niektórych przypadkach użycia.
Podsumowując, kod dla wielu platform powinien wyglądać mniej więcej tak ...
import os
import platform
def creation_date(path_to_file):
"""
Try to get the date that a file was created, falling back to when it was
last modified if that isn't possible.
See http://stackoverflow.com/a/39501288/1709587 for explanation.
"""
if platform.system() == 'Windows':
return os.path.getctime(path_to_file)
else:
stat = os.stat(path_to_file)
try:
return stat.st_birthtime
except AttributeError:
# We're probably on Linux. No easy way to get creation dates here,
# so we'll settle for when its content was last modified.
return stat.st_mtime
ext4
dyskach pod Linuksem i chciałbym dowiedzieć się, co się dzieje, gdy Linux odczytuje pliki napisane przez Windows lub odwrotnie, biorąc pod uwagę, że używają one st_ctime
inaczej.
"w"
, nie zastępuje go, po prostu otwiera istniejący plik i obcina go. Mimo że zawartość pliku jest całkowicie niezwiązana z tym, co miał podczas tworzenia, nadal można powiedzieć, że plik został „utworzony” na długo przed bieżącą wersją. I na odwrót, redaktorzy używający zamiany atomowej podczas zapisywania (oryginalny plik jest zastępowany nowym plikiem tymczasowym w toku) wyświetlałby późniejszą datę utworzenia, nawet jeśli usunąłeś tylko jeden znak. Użyj czasu modyfikacji, nie puszczaj gruba na czas tworzenia.
stat.st_ctime
jest bardziej istotne, ponieważ w wielu przypadkach czasem ostatniej zmiany metadanych może być czas utworzenia (przynajmniej ctime
bliższy rzeczywistemu czasowi tworzenia niż mtime
). Dlatego możesz po prostu zastąpić swój fragment stat = os.stat(path_to_file); try: return stat.st_birthtime; except AttributeError: return stat.st_ctime
. Co myślisz? Pozdrawiam
ctime
zawsze powinien być równy lub później niż mtime
, ponieważ mtime
zmiana powoduje to ctime
zmianę (bo mtime
sam jest uważany za „metadane”). Zobacz stackoverflow.com/a/39521489/1709587, gdzie podam przykładowy kod ilustrujący to.
Masz kilka możliwości. Po pierwsze możesz użyć funkcji os.path.getmtime
i os.path.getctime
:
import os.path, time
print("last modified: %s" % time.ctime(os.path.getmtime(file)))
print("created: %s" % time.ctime(os.path.getctime(file)))
Inną opcją jest użycie os.stat
:
import os, time
(mode, ino, dev, nlink, uid, gid, size, atime, mtime, ctime) = os.stat(file)
print("last modified: %s" % time.ctime(mtime))
Uwaga : ctime()
nie nie odnoszą się do czasu utworzenia na systemów uniksowych, ale raczej ostatni raz dane iwęzłów zmieniło. (podziękowania dla kojiro za wyjaśnienie tego faktu w komentarzach poprzez podanie linku do interesującego posta na blogu)
ctime
zostanie zaktualizowany, gdy mtime
robi (ponieważ mtime
jest „metadane”), a więc ctime
jest zwykle zawsze równa lub przedmtime
. Traktowanie ctime
jak czas „stworzony” nie ma zatem żadnego sensu. -1!
Last modified: Fri Jan 31 11:08:13 2020
i Created: Fri Jan 31 11:08:13 2020
na Linux Ubuntu 16.04!
time.ctime(os.path.getmtime(file))
zwraca 2 typy ciągów, w zależności od tego, czy plik został zmodyfikowany przez system, czy przez użytkownika. Jeśli został zmodyfikowany przez system, łańcuch będzie zawierał 2 spacje między miesiącem a dniem. Nie wiem dlaczego
Najlepszą funkcją do tego celu jest os.path.getmtime () . To po prostu wykorzystuje os.stat(filename).st_mtime
.
Moduł datetime jest najlepszym manipulowaniem znacznikami czasu, więc datę modyfikacji można uzyskać jako datetime
obiekt taki jak ten:
import os
import datetime
def modification_date(filename):
t = os.path.getmtime(filename)
return datetime.datetime.fromtimestamp(t)
Przykład użycia:
>>> d = modification_date('/var/log/syslog')
>>> print d
2009-10-06 10:50:01
>>> print repr(d)
datetime.datetime(2009, 10, 6, 10, 50, 1)
getmtime
jest najbliższą rzeczą dostępną w systemie Unix (gdzie uzyskanie dat utworzenia nie jest możliwe), ale zdecydowanie nie jest najlepszą funkcją do użycia w systemie Windows, gdzie ctime
jest czas utworzenia.
os.stat https://docs.python.org/2/library/stat.html#module-stat
edit: W nowszym kodzie powinieneś prawdopodobnie użyć os.path.getmtime () (dzięki Christian Oudard),
ale zwróć uwagę, że zwraca zmiennoprzecinkową wartość time_t z ułamkiem sekund (jeśli twój system to obsługuje)
os.path.getmtime()
istnieje od czasu wydania Python 1.5.2 (patrz stare dokumenty ), wydanego zanim straciłem większość zębów mlecznych i prawie dekadę przed napisaniem oryginalnej wersji tej odpowiedzi.
Istnieją dwie metody uzyskania czasu mod, os.path.getmtime () lub os.stat (), ale ctime nie jest wiarygodny na różnych platformach (patrz poniżej).
getmtime ( ścieżka )
Zwraca czas ostatniej modyfikacji ścieżki. Wartość zwracana to liczba podająca liczbę sekund od epoki (patrz moduł czasu). Podnieś os.error, jeśli plik nie istnieje lub jest niedostępny. Nowości w wersji 1.5.2. Zmieniono w wersji 2.3: Jeśli os.stat_float_times () zwraca True, wynikiem jest liczba zmiennoprzecinkowa.
stat ( ścieżka )
Wykonaj wywołanie systemowe stat () na podanej ścieżce. Zwracana wartość to obiekt, którego atrybuty odpowiadają elementom struktury statystyki, a mianowicie: st_mode (bity ochronne), st_ino (numer i-węzła), st_dev (urządzenie), st_nlink (liczba twardych dowiązań), st_uid (identyfikator użytkownika właściciela ), st_gid (identyfikator grupy właściciela), st_size (rozmiar pliku, w bajtach), st_atime (czas ostatniego dostępu), st_mtime (czas ostatniej modyfikacji treści), st_ctime (zależny od platformy; czas ostatniej zmiany metadanych w systemie Unix lub czas utworzenia w systemie Windows) :
>>> import os
>>> statinfo = os.stat('somefile.txt')
>>> statinfo
(33188, 422511L, 769L, 1, 1032, 100, 926L, 1105022698,1105022732, 1105022732)
>>> statinfo.st_size
926L
>>>
W powyższym przykładzie użyjesz statinfo.st_mtime lub statinfo.st_ctime, aby uzyskać odpowiednio mtime i ctime.
W Pythonie 3.4 i nowszych można użyć zorientowanego obiektowo interfejsu modułu pathlib , który zawiera opakowania dla większości modułów systemu operacyjnego . Oto przykład pobierania statystyk plików.
>>> import pathlib
>>> fname = pathlib.Path('test.py')
>>> assert fname.exists(), f'No such file: {fname}' # check that the file exists
>>> print(fname.stat())
os.stat_result(st_mode=33206, st_ino=5066549581564298, st_dev=573948050, st_nlink=1, st_uid=0, st_gid=0, st_size=413, st_atime=1523480272, st_mtime=1539787740, st_ctime=1523480272)
Aby uzyskać więcej informacji o tym os.stat_result
, co zawiera, zapoznaj się z dokumentacją . Dla potrzebnego czasu modyfikacji fname.stat().st_mtime
:
>>> import datetime
>>> mtime = datetime.datetime.fromtimestamp(fname.stat().st_mtime)
>>> print(mtime)
datetime.datetime(2018, 10, 17, 10, 49, 0, 249980)
Jeśli chcesz czas utworzenia w systemie Windows lub najnowszą zmianę metadanych w systemie Unix, możesz użyć fname.stat().st_ctime
:
>>> ctime = datetime.datetime.fromtimestamp(fname.stat().st_ctime)
>>> print(ctime)
datetime.datetime(2018, 4, 11, 16, 57, 52, 151953)
Ten artykuł zawiera bardziej pomocne informacje i przykłady dotyczące modułu pathlib.
os.stat
zwraca nazwaną krotkę z atrybutami st_mtime
i st_ctime
. Czas modyfikacji jest st_mtime
na obu platformach; niestety w systemie Windows ctime
oznacza „czas utworzenia”, podczas gdy w systemie POSIX oznacza „czas zmiany”. Nie znam żadnego sposobu na uzyskanie czasu tworzenia na platformach POSIX.
dir(..)
jednego. Np.dir(os.stat(os.listdir('.')[0]))
import os, time, datetime
file = "somefile.txt"
print(file)
print("Modified")
print(os.stat(file)[-2])
print(os.stat(file).st_mtime)
print(os.path.getmtime(file))
print()
print("Created")
print(os.stat(file)[-1])
print(os.stat(file).st_ctime)
print(os.path.getctime(file))
print()
modified = os.path.getmtime(file)
print("Date modified: "+time.ctime(modified))
print("Date modified:",datetime.datetime.fromtimestamp(modified))
year,month,day,hour,minute,second=time.localtime(modified)[:-3]
print("Date modified: %02d/%02d/%d %02d:%02d:%02d"%(day,month,year,hour,minute,second))
print()
created = os.path.getctime(file)
print("Date created: "+time.ctime(created))
print("Date created:",datetime.datetime.fromtimestamp(created))
year,month,day,hour,minute,second=time.localtime(created)[:-3]
print("Date created: %02d/%02d/%d %02d:%02d:%02d"%(day,month,year,hour,minute,second))
odciski
somefile.txt
Modified
1429613446
1429613446.0
1429613446.0
Created
1517491049
1517491049.28306
1517491049.28306
Date modified: Tue Apr 21 11:50:46 2015
Date modified: 2015-04-21 11:50:46
Date modified: 21/04/2015 11:50:46
Date created: Thu Feb 1 13:17:29 2018
Date created: 2018-02-01 13:17:29.283060
Date created: 01/02/2018 13:17:29
>>> import os
>>> os.stat('feedparser.py').st_mtime
1136961142.0
>>> os.stat('feedparser.py').st_ctime
1222664012.233
>>>
Jeśli podążanie za dowiązaniami symbolicznymi nie jest ważne, możesz również użyć os.lstat
wbudowanego.
>>> os.lstat("2048.py")
posix.stat_result(st_mode=33188, st_ino=4172202, st_dev=16777218L, st_nlink=1, st_uid=501, st_gid=20, st_size=2078, st_atime=1423378041, st_mtime=1423377552, st_ctime=1423377553)
>>> os.lstat("2048.py").st_atime
1423378041.0
Warto spojrzeć na crtime
bibliotekę, która implementuje międzyplatformowy dostęp do czasu tworzenia pliku.
from crtime import get_crtimes_in_dir
for fname, date in get_crtimes_in_dir(".", raise_on_error=True, as_epoch=False):
print(fname, date)
# file_a.py Mon Mar 18 20:51:18 CET 2019
debugfs
w Linuksie, który z definicji jest niestabilny, wymaga dostępu do konta root na najwyższym poziomie i praktycznie w każdym aspekcie jest jedną z rzeczy, o których zawsze ostrzegała cię twoja matka. (Ale tak, to prawdopodobnie działa, jeśli naprawdę jesteś zdesperowany i zdarza ci się być prawdziwym superużytkownikiem w systemie bez bezpiecznego rozruchu…)
os.stat
obejmuje czas utworzenia. Po prostu nie ma definicji st_anything dla elementu, os.stat()
który zawiera czas.
Spróbuj tego:
os.stat('feedparser.py')[8]
Porównaj to ze swoją datą utworzenia w pliku w ls -lah
Powinny być takie same.
Byłem w stanie uzyskać czas tworzenia na posix, uruchamiając komendę systemową statystyki i analizując dane wyjściowe.
commands.getoutput('stat FILENAME').split('\"')[7]
Uruchomienie statystyki poza pythonem z terminala (OS X) zwróciło:
805306374 3382786932 -rwx------ 1 km staff 0 1098083 "Aug 29 12:02:05 2013" "Aug 29 12:02:05 2013" "Aug 29 12:02:20 2013" "Aug 27 12:35:28 2013" 61440 2150 0 testfile.txt
... gdzie czwartym czasem danych jest tworzenie pliku (zamiast czasu zmiany ctime, jak zauważono w innych komentarzach).