Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

4
Pandas DataFrame do listy słowników
Mam następującą ramkę DataFrame: klient pozycja1 pozycja2 pozycja3 1 pomidor jabłkowy 2 pomarańczowe ziemniaki wodne 3 sok z chipsów mango które chcę przetłumaczyć na listę słowników w wierszu rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', …

8
Przenieś wiele list do ramki danych
Jak wziąć wiele list i umieścić je jako różne kolumny w ramce danych Pythona? Wypróbowałem to rozwiązanie, ale miałem problemy. Próba 1: Miej trzy listy, spakuj je razem i użyj tego res = zip(lst1,lst2,lst3) Daje tylko jedną kolumnę Próba 2: percentile_list = pd.DataFrame({'lst1Tite' : [lst1], 'lst2Tite' : [lst2], 'lst3Tite' : …
164 python  numpy  pandas 

10
Kolumna Pandy z listami, utwórz wiersz dla każdego elementu listy
Mam ramkę danych, w której niektóre komórki zawierają listy wielu wartości. Zamiast przechowywać wiele wartości w komórce, chciałbym rozszerzyć ramkę danych, aby każdy element na liście miał swój własny wiersz (z tymi samymi wartościami we wszystkich innych kolumnach). Więc jeśli mam: import pandas as pd import numpy as np df …
163 python  pandas  list 



5
Formatowanie / pomijanie notacji naukowej z wyników agregacji Python Pandas
Jak można zmodyfikować format danych wyjściowych z operacji grupowej w pandach, która tworzy notację naukową dla bardzo dużych liczb? Wiem, jak wykonać formatowanie ciągów znaków w Pythonie, ale nie mam pojęcia, jak je tutaj zastosować. df1.groupby('dept')['data1'].sum() dept value1 1.192433e+08 value2 1.293066e+08 value3 1.077142e+08 To pomija notację naukową, jeśli konwertuję na …



8
NumPy lub Pandas: Zachowywanie typu tablicy jako liczby całkowitej z wartością NaN
Czy istnieje preferowany sposób, aby zachować typ danych numpytablicy ustalony jako int( int64lub cokolwiek), jednocześnie mając wewnątrz element wymieniony jako numpy.NaN? W szczególności konwertuję wewnętrzną strukturę danych na Pandas DataFrame. W naszej strukturze mamy kolumny typu całkowitego, które nadal mają NaN (ale dtype kolumny to int). Wygląda na to, że …

5
Scal dwie ramki danych według indeksu
Cześć, mam następujące ramki danych: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B Jak połączyć indeksy, aby uzyskać: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 …

6
Usuń wszystkie zduplikowane wiersze w Python Pandas
pandas drop_duplicatesFunkcja jest wielki dla „uniquifying” do dataframe. Jednak jednym z argumentów słów kluczowych do przekazania jest take_last=Truelub take_last=False, podczas gdy chciałbym usunąć wszystkie wiersze, które są duplikatami w podzbiorze kolumn. czy to możliwe? A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 …

6
Losowy wybór wierszy w ramce danych Pandas
Czy istnieje sposób na wybranie losowych wierszy z DataFrame w Pandas. W R, korzystając z pakietu samochodowego, jest przydatna funkcja, some(x, n)która jest podobna do head, ale w tym przykładzie wybiera losowo 10 wierszy z x. Przejrzałem również dokumentację dotyczącą wycinania i wydaje się, że nie ma nic równoważnego. Aktualizacja …
159 python  pandas 

9
Załaduj dane z txt za pomocą pand
Ładuję plik txt zawierający mieszankę danych typu float i string. Chcę przechowywać je w tablicy, w której mam dostęp do każdego elementu. Teraz po prostu robię import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Jest to struktura pliku wejściowego: 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt. Teraz …
159 python  io  pandas 

6
Wskaźnik postępu podczas operacji pand
Regularnie wykonuję operacje na pandach na ramkach danych w ponad 15 milionach wierszy i chciałbym mieć dostęp do wskaźnika postępu dla poszczególnych operacji. Czy istnieje tekstowy wskaźnik postępu dla operacji pandy podziel-zastosuj-połącz? Na przykład w czymś takim: df_users.groupby(['userID', 'requestDate']).apply(feature_rollup) gdzie feature_rollupjest dość skomplikowaną funkcją, która pobiera wiele kolumn DF i …
158 python  pandas  ipython 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.