Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

4
Jak wykreślić dwie kolumny ramki danych pandy za pomocą punktów?
Mam ramkę danych pandy i chciałbym wykreślić wartości z jednej kolumny w porównaniu z wartościami z innej kolumny. Na szczęście istnieje plotmetoda związana z ramkami danych, która wydaje się robić to, czego potrzebuję: df.plot(x='col_name_1', y='col_name_2') Niestety wygląda na to, że wśród stylów działek (wymienionych tutaj po kindparametrze) nie ma punktów. …

3
Łączna liczba pand jest różna
Powiedzmy, że mam dziennik aktywności użytkowników i chcę wygenerować raport o łącznym czasie trwania i liczbie unikalnych użytkowników dziennie. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) Sumowanie czasu trwania jest dość proste: …
97 python  pandas 

6
Czy w Pandas jest sposób na użycie wartości poprzedniego wiersza w dataframe.apply, gdy poprzednia wartość jest również obliczana w Apply?
Mam następującą ramkę danych: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Wymagać: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 10 60 …

4
Jaka jest różnica między pandas.qcut i pandas.cut?
Dokumentacja mówi: http://pandas.pydata.org/pandas-docs/dev/basics.html „Wartości ciągłe można dyskretyzować za pomocą funkcji cut (pojemniki oparte na wartościach) i qcut (pojemniki oparte na kwantylach próbek)” Brzmi dla mnie bardzo abstrakcyjnie ... Widzę różnice w poniższym przykładzie, ale co właściwie robi / oznacza qcut (kwantyl próbki)? Kiedy użyłbyś qcut zamiast cut? Dzięki. factors = …
96 python  pandas 

1
Jakie są argumenty „poziomów”, „kluczy” i nazw w funkcji concat Pandy?
pytania Jak używać pd.concat? Jaki jest levelsargument za? Jaki jest keysargument za? Czy jest kilka przykładów, które pomogą wyjaśnić, jak używać wszystkich argumentów? concatFunkcją Pandy jest szwajcarski scyzoryk łączących się narzędzi. Sytuacje, w których jest to przydatne, są liczne. Istniejąca dokumentacja pomija kilka szczegółów na temat niektórych opcjonalnych argumentów. Wśród …
96 python  pandas 

11
Znajdź indeks całkowity wierszy z NaN w ramce danych pandy
Mam takie pandy DataFrame: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 Czy istnieje skuteczny sposób …
96 python  pandas 

6
Czy iterrows pandy mają problemy z wydajnością?
Zauważyłem bardzo słabą wydajność podczas używania iterrows od pand. Czy jest to coś, czego doświadczają inni? Czy jest to specyficzne dla iterrows i czy należy unikać tej funkcji dla danych o określonym rozmiarze (pracuję z 2-3 milionami wierszy)? Ta dyskusja na GitHub doprowadziła mnie do przekonania, że ​​jest to spowodowane …


3
Jak mogę usunąć białe znaki z nagłówków Pandas DataFrame?
Analizuję dane z pliku Excela, który ma dodatkowe białe miejsce w niektórych nagłówkach kolumn. Kiedy sprawdzam kolumny wynikowej ramki danych za pomocą df.columns, widzę: Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' W związku z tym nie mogę: df["Month"] Ponieważ powie mi, że kolumna …

10
Usuwanie wielu kolumn na podstawie nazw kolumn w Pandas
Mam trochę danych i kiedy je importuję, otrzymuję następujące niepotrzebne kolumny Szukam łatwego sposobu na usunięcie ich wszystkich 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38', 'Unnamed: 39', …
96 python  pandas 


11
Jak rozbić listę w komórce Dataframe na oddzielne wiersze
Chcę zamienić komórkę pandy zawierającą listę w wiersze dla każdej z tych wartości. Więc weź to: Jeśli chciałbym rozpakować i ułożyć wartości w nearest_neighborskolumnie, tak aby każda wartość była wierszem w każdym opponentindeksie, jak najlepiej się do tego zabrać? Czy istnieją metody pandy przeznaczone do takich operacji?

5
Dodawanie etykiet wartości na wykresie słupkowym matplotlib
Utknąłem w czymś, co wydaje się stosunkowo łatwe. Kod, który przedstawiam poniżej, jest przykładem opartym na większym projekcie, nad którym pracuję. Nie widziałem powodu, aby publikować wszystkie szczegóły, więc zaakceptuj struktury danych, które przyniosłem. Zasadniczo tworzę wykres słupkowy i mogę po prostu dowiedzieć się, jak dodać etykiety wartości do słupków …

6
Wyświetlanie pionowych linii siatki na wykresie linii w matplotlib
Chcę uzyskać na wykresie zarówno poziome, jak i pionowe linie siatki, ale domyślnie pojawiają się tylko poziome linie siatki. Używam pandas.DataFramez kwerendy sql w Pythonie, aby wygenerować wykres liniowy z datami na osi x. Nie jestem pewien, dlaczego nie pojawiają się one w datach i próbowałem znaleźć odpowiedź na to …

6
Wykreślanie danych kategorycznych za pomocą pand i matplotlib
Mam ramkę danych z danymi kategorycznymi: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue down Chcę wygenerować wykresy, takie jak wykresy kołowe i histogramy na podstawie kategorii. Czy jest to możliwe bez tworzenia fikcyjnych zmiennych numerycznych? …
95 python  pandas 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.