Odpowiedzi:
Najprostszym sposobem jest użycie to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Jest to również dayfirst
argument za czasami europejskimi (ale uważaj, to nie jest ścisłe ).
Oto jest w akcji:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Możesz przekazać określony format :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
powinny działać.
SettingWithCopyWarning
daje wystarczającą ilość materiału
Jeśli kolumna z datą jest łańcuchem w formacie „2017-01-01”, możesz użyć pandy astype, aby przekonwertować ją na datę i godzinę.
df['date'] = df['date'].astype('datetime64[ns]')
lub użyj datetime64 [D], jeśli chcesz precyzji dnia, a nie nanosekund
print(type(df_launath['date'].iloc[0]))
daje
<class 'pandas._libs.tslib.Timestamp'>
tak samo jak w przypadku korzystania z pandas.to_datetime
Możesz spróbować z innymi formatami niż „% Y-% m-% d”, ale przynajmniej to działa.
Jeśli chcesz określić trudne formaty, możesz użyć następujących opcji:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
Więcej informacji format
tutaj:
Jeśli masz randkę z wieloma formatami, nie zapomnij ustawić, infer_datetime_format=True
aby ułatwić życie
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Źródło: pd.to_datetime
lub jeśli chcesz niestandardowego podejścia:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)