Stare pytanie, ale zgaduję, że niektórzy wciąż tego szukają - więc ...
Uważam tę metodę za fajną, ponieważ wszystkie arkusze są ładowane do słownika par nazw arkuszy i par ramek danych, utworzonych przez pandy z opcją Sheetname = None. Dodawanie, usuwanie lub modyfikowanie arkuszy roboczych między odczytem arkusza kalkulacyjnego w formacie dykta a zapisaniem go z powrotem z dyktowania jest proste. Dla mnie xlsxwriter działa lepiej niż openpyxl w tym konkretnym zadaniu pod względem szybkości i formatu.
Uwaga: przyszłe wersje pand (0.21.0+) zmienią parametr „nazwa arkusza” na „nazwa_arkusza”.
# read a single or multi-sheet excel file
# (returns dict of sheetname(s), dataframe(s))
ws_dict = pd.read_excel(excel_file_path,
sheetname=None)
# all worksheets are accessible as dataframes.
# easy to change a worksheet as a dataframe:
mod_df = ws_dict['existing_worksheet']
# do work on mod_df...then reassign
ws_dict['existing_worksheet'] = mod_df
# add a dataframe to the workbook as a new worksheet with
# ws name, df as dict key, value:
ws_dict['new_worksheet'] = some_other_dataframe
# when done, write dictionary back to excel...
# xlsxwriter honors datetime and date formats
# (only included as example)...
with pd.ExcelWriter(excel_file_path,
engine='xlsxwriter',
datetime_format='yyyy-mm-dd',
date_format='yyyy-mm-dd') as writer:
for ws_name, df_sheet in ws_dict.items():
df_sheet.to_excel(writer, sheet_name=ws_name)
Na przykład w pytaniu z 2013 roku:
ws_dict = pd.read_excel('Masterfile.xlsx',
sheetname=None)
ws_dict['Main'] = data_filtered[['Diff1', 'Diff2']]
with pd.ExcelWriter('Masterfile.xlsx',
engine='xlsxwriter') as writer:
for ws_name, df_sheet in ws_dict.items():
df_sheet.to_excel(writer, sheet_name=ws_name)