Programowanie pandas

4

Mam następującą ramkę DataFrame: klient pozycja1 pozycja2 pozycja3 1 pomidor jabłkowy 2 pomarańczowe ziemniaki wodne 3 sok z chipsów mango które chcę przetłumaczyć na listę słowników w wierszu rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', …

165 python list dictionary pandas dataframe

8

Przenieś wiele list do ramki danych

Jak wziąć wiele list i umieścić je jako różne kolumny w ramce danych Pythona? Wypróbowałem to rozwiązanie, ale miałem problemy. Próba 1: Miej trzy listy, spakuj je razem i użyj tego res = zip(lst1,lst2,lst3) Daje tylko jedną kolumnę Próba 2: percentile_list = pd.DataFrame({'lst1Tite' : [lst1], 'lst2Tite' : [lst2], 'lst3Tite' : …

164 python numpy pandas

10

Kolumna Pandy z listami, utwórz wiersz dla każdego elementu listy

Mam ramkę danych, w której niektóre komórki zawierają listy wielu wartości. Zamiast przechowywać wiele wartości w komórce, chciałbym rozszerzyć ramkę danych, aby każdy element na liście miał swój własny wiersz (z tymi samymi wartościami we wszystkich innych kolumnach). Więc jeśli mam: import pandas as pd import numpy as np df …

163 python pandas list

13

Porównaj dwie ramki DataFrame i wyświetl ich różnice obok siebie

Próbuję dokładnie podkreślić, co zmieniło się między dwiema ramkami danych. Załóżmy, że mam dwie ramki danych Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled Comment …

162 python html pandas dataframe panel

3

Pandy uzyskują najwyższe n rekordów w każdej grupie

Załóżmy, że mam pandy DataFrame w ten sposób: >>> df = pd.DataFrame({'id':[1,1,1,2,2,2,2,3,4],'value':[1,2,3,1,2,3,4,1,1]}) >>> df id value 0 1 1 1 1 2 2 1 3 3 2 1 4 2 2 5 2 3 6 2 4 7 3 1 8 4 1 Chcę uzyskać nową ramkę DataFrame z 2 …

162 python pandas greatest-n-per-group window-functions top-n

5

Formatowanie / pomijanie notacji naukowej z wyników agregacji Python Pandas

Jak można zmodyfikować format danych wyjściowych z operacji grupowej w pandach, która tworzy notację naukową dla bardzo dużych liczb? Wiem, jak wykonać formatowanie ciągów znaków w Pythonie, ale nie mam pojęcia, jak je tutaj zastosować. df1.groupby('dept')['data1'].sum() dept value1 1.192433e+08 value2 1.293066e+08 value3 1.077142e+08 To pomija notację naukową, jeśli konwertuję na …

162 python pandas floating-point scientific-notation number-formatting

12

pandy pythonowe: Usuń duplikaty według kolumn A, zachowując wiersz o najwyższej wartości w kolumnie B.

Mam ramkę danych z powtarzającymi się wartościami w kolumnie A. Chcę usunąć duplikaty, zachowując wiersz z najwyższą wartością w kolumnie B. Więc to: A B 1 10 1 20 2 30 2 40 3 10 Powinien zmienić się w to: A B 1 20 2 40 3 10 Wes dodał …

162 python duplicates pandas

4

Dlaczego łączenie pand w Pythonie było szybsze niż data.table w R w 2012 roku?

Niedawno natknąłem się na bibliotekę pand dla Pythona, która według tego testu porównawczego wykonuje bardzo szybkie połączenia w pamięci. Jest nawet szybszy niż pakiet data.table w R (mój język do analizy). Dlaczego jest pandaso wiele szybszy niż data.table? Czy to z powodu nieodłącznej przewagi szybkości, jaką Python ma nad R, …

160 python r join data.table pandas

8

NumPy lub Pandas: Zachowywanie typu tablicy jako liczby całkowitej z wartością NaN

Czy istnieje preferowany sposób, aby zachować typ danych numpytablicy ustalony jako int( int64lub cokolwiek), jednocześnie mając wewnątrz element wymieniony jako numpy.NaN? W szczególności konwertuję wewnętrzną strukturę danych na Pandas DataFrame. W naszej strukturze mamy kolumny typu całkowitego, które nadal mają NaN (ale dtype kolumny to int). Wygląda na to, że …

160 python numpy int pandas type-conversion

5

Scal dwie ramki danych według indeksu

Cześć, mam następujące ramki danych: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B Jak połączyć indeksy, aby uzyskać: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 …

160 python pandas dataframe merge concat

6

Usuń wszystkie zduplikowane wiersze w Python Pandas

pandas drop_duplicatesFunkcja jest wielki dla „uniquifying” do dataframe. Jednak jednym z argumentów słów kluczowych do przekazania jest take_last=Truelub take_last=False, podczas gdy chciałbym usunąć wszystkie wiersze, które są duplikatami w podzbiorze kolumn. czy to możliwe? A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 …

160 python pandas duplicates

6

Losowy wybór wierszy w ramce danych Pandas

Czy istnieje sposób na wybranie losowych wierszy z DataFrame w Pandas. W R, korzystając z pakietu samochodowego, jest przydatna funkcja, some(x, n)która jest podobna do head, ale w tym przykładzie wybiera losowo 10 wierszy z x. Przejrzałem również dokumentację dotyczącą wycinania i wydaje się, że nie ma nic równoważnego. Aktualizacja …

159 python pandas

9

Załaduj dane z txt za pomocą pand

Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę przechowywać je w tablicy, w której mam dostęp do każdego elementu. Teraz po prostu robię import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Jest to struktura pliku wejściowego: 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt. Teraz …

159 python io pandas

6

Wskaźnik postępu podczas operacji pand

Regularnie wykonuję operacje na pandach na ramkach danych w ponad 15 milionach wierszy i chciałbym mieć dostęp do wskaźnika postępu dla poszczególnych operacji. Czy istnieje tekstowy wskaźnik postępu dla operacji pandy podziel-zastosuj-połącz? Na przykład w czymś takim: df_users.groupby(['userID', 'requestDate']).apply(feature_rollup) gdzie feature_rollupjest dość skomplikowaną funkcją, która pobiera wiele kolumn DF i …

158 python pandas ipython

9

Jak zamienić NaNs przez poprzedzające wartości w pandas DataFrame?

Załóżmy, że mam DataFrame z kilkoma NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2 0 1 2 3 1 4 NaN NaN 2 NaN NaN 9 To, co muszę zrobić, to zastąpić każdy NaNpierwszym nie- …

158 python python-3.x pandas dataframe nan

Pytania otagowane jako pandas