Chcę używać plików programu Excel do przechowywania danych opracowanych w Pythonie. Mój problem polega na tym, że nie mogę dodać arkuszy do istniejącego pliku Excela. Tutaj proponuję przykładowy kod do pracy w celu rozwiązania tego problemu
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x1 = np.random.randn(100, 2)
df1 = pd.DataFrame(x1)
x2 = np.random.randn(100, 2)
df2 = pd.DataFrame(x2)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df1.to_excel(writer, sheet_name = 'x1')
df2.to_excel(writer, sheet_name = 'x2')
writer.save()
writer.close()
Ten kod zapisuje dwie ramki DataFrame w dwóch arkuszach o nazwach odpowiednio „x1” i „x2”. Jeśli utworzę dwie nowe ramki DataFrames i spróbuję użyć tego samego kodu, aby dodać dwa nowe arkusze, „x3” i „x4”, oryginalne dane zostaną utracone.
import pandas as pd
import numpy as np
path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx"
x3 = np.random.randn(100, 2)
df3 = pd.DataFrame(x3)
x4 = np.random.randn(100, 2)
df4 = pd.DataFrame(x4)
writer = pd.ExcelWriter(path, engine = 'xlsxwriter')
df3.to_excel(writer, sheet_name = 'x3')
df4.to_excel(writer, sheet_name = 'x4')
writer.save()
writer.close()
Chcę mieć plik Excela z czterema arkuszami: „x1”, „x2”, „x3”, „x4”. Wiem, że „xlsxwriter” nie jest jedynym „silnikiem”, istnieje „openpyxl”. Widziałem też, że są już inni ludzie, którzy pisali o tym problemie, ale nadal nie rozumiem, jak to zrobić.
Tutaj kod pobrany z tego linku
import pandas
from openpyxl import load_workbook
book = load_workbook('Masterfile.xlsx')
writer = pandas.ExcelWriter('Masterfile.xlsx', engine='openpyxl')
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2'])
writer.save()
Mówią, że to działa, ale trudno zrozumieć, jak. Nie rozumiem, co w tym kontekście oznacza „ws.title”, „ws” i „dict”.
Jaki jest najlepszy sposób na zapisanie „x1” i „x2”, a następnie zamknięcie pliku, ponowne otwarcie go i dodanie „x3” i „x4”?