Pandas DataFrame do listy słowników


165

Mam następującą ramkę DataFrame:

klient pozycja1 pozycja2 pozycja3
1 pomidor jabłkowy
2 pomarańczowe ziemniaki wodne
3 sok z chipsów mango

które chcę przetłumaczyć na listę słowników w wierszu

rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
    {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
    {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Witamy w Stack Overflow! Wcięłem przykładowy kod o 4 spacje, aby renderował się poprawnie - zobacz pomoc dotyczącą edycji, aby uzyskać więcej informacji na temat formatowania.
ByteHamster

Odpowiedzi:


189

Edytować

Jak wspomina John Galt w swojej odpowiedzi , prawdopodobnie powinieneś zamiast tego użyć df.to_dict('records'). To szybsze niż transpozycja ręczna.

In [20]: timeit df.T.to_dict().values()
1000 loops, best of 3: 395 µs per loop

In [21]: timeit df.to_dict('records')
10000 loops, best of 3: 53 µs per loop

Oryginalna odpowiedź

Użyj df.T.to_dict().values(), jak poniżej:

In [1]: df
Out[1]:
   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Jakie byłoby rozwiązanie w przypadku ramki danych zawierającej dla każdego Klienta wiele wierszy?
Aziz

2
Kiedy używam df.T.to_dict().values(), tracę również porządek sortowania
Hussain

Podczas otwierania pliku csv do listy dicts, Dostaję dwukrotnie większą prędkość zunicodecsv.DictReader
radtek

220

Użyj df.to_dict('records')- daje wynik bez konieczności zewnętrznej transpozycji.

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Jak zmienić, aby uwzględnić wartość indeksu w każdym wpisie listy wynikowej?
Gabriel L. Oliveira

5
@ GabrielL.Oliveira you can do df.reset_index (). To_dict ('records')
Wei Ma

Czy kolejność kolumn jest w każdym przypadku zastrzeżona, tj. Czy n-ty wpis w wynikowej liście zawsze jest również n-tą kolumną?
Cleb

@Cleb to i.e. is the nth entry in the resulting list always also the nth column?n-ta kolumna czy n-ty wiersz?
Nauman Naeem

14

Jako rozszerzenie odpowiedzi Johna Galta -

W przypadku następującej ramki DataFrame

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

Jeśli chcesz uzyskać listę słowników zawierającą wartości indeksu, możesz zrobić coś takiego,

df.to_dict('index')

Który generuje słownik słowników, w którym klucze słownika nadrzędnego są wartościami indeksu. W tym konkretnym przypadku

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

1

Jeśli chcesz wybrać tylko jedną kolumnę, zadziała.

df[["item1"]].to_dict("records")

Poniższe NIE zadziała i utworzy TypeError: unsupported type:. Uważam, że dzieje się tak, ponieważ próbuje przekonwertować serię na dykt, a nie ramkę danych na dyktę.

df["item1"].to_dict("records")

Miałem wymóg, aby wybrać tylko jedną kolumnę i przekonwertować ją na listę dykt z nazwą kolumny jako kluczem i utknąłem na tym trochę, więc pomyślałem, że podzielę się.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.