Należy pamiętać, że np.array_split(df, 3)
dzieli ramkę danych na 3 podramki danych, podczas gdy split_dataframe
funkcja zdefiniowana w odpowiedzi @ elixir , wywoływana jako split_dataframe(df, chunk_size=3)
, dzieli ramkę danych w każdym chunk_size
wierszu.
Przykład:
Z np.array_split
:
df = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11], columns=['TEST'])
df_split = np.array_split(df, 3)
... otrzymujesz 3 pod-ramki danych:
df_split[0]
df_split[1]
df_split[2]
Z split_dataframe
:
df_split2 = split_dataframe(df, chunk_size=3)
... otrzymujesz 4 podramki danych:
df_split2[0]
df_split2[1]
df_split2[2]
df_split2[3]
Mam nadzieję, że mam rację i że to jest przydatne.
np.split(df, N)
funkcji, proszę.