Należy pamiętać, że np.array_split(df, 3)dzieli ramkę danych na 3 podramki danych, podczas gdy split_dataframefunkcja zdefiniowana w odpowiedzi @ elixir , wywoływana jako split_dataframe(df, chunk_size=3), dzieli ramkę danych w każdym chunk_sizewierszu.
Przykład:
Z np.array_split:
df = pd.DataFrame([1,2,3,4,5,6,7,8,9,10,11], columns=['TEST'])
df_split = np.array_split(df, 3)
... otrzymujesz 3 pod-ramki danych:
df_split[0]
df_split[1]
df_split[2]
Z split_dataframe:
df_split2 = split_dataframe(df, chunk_size=3)
... otrzymujesz 4 podramki danych:
df_split2[0]
df_split2[1]
df_split2[2]
df_split2[3]
Mam nadzieję, że mam rację i że to jest przydatne.
np.split(df, N)funkcji, proszę.