Pytania otagowane jako pandas-groupby

Służy do grupowania razem zmiennych na podstawie określonego warunku. I tylko do użytku w odniesieniu do biblioteki „pandy”


7
Czy uzyskać statystyki dla każdej grupy (takie jak liczba, średnia itp.) Za pomocą pand GroupBy?
Mam ramkę danych dfi używam z niej kilku kolumn do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() W powyższy sposób prawie otrzymuję potrzebną tabelę (ramkę danych). Brakuje dodatkowej kolumny, która zawiera liczbę wierszy w każdej grupie. Innymi słowy, mam na myśli, ale chciałbym również wiedzieć, ile liczb wykorzystano do uzyskania tych środków. Na przykład w …

2
Jak obrócić ramkę danych
Co to jest oś obrotu? Jak się obracać? Czy to jest oś obrotu? Długi format do szerokiego formatu? Widziałem wiele pytań dotyczących tabel przestawnych. Nawet jeśli nie wiedzą, że pytają o tabele przestawne, zwykle tak są. Praktycznie niemożliwe jest napisanie kanonicznego pytania i odpowiedzi, które obejmują wszystkie aspekty obrotu ... …




9
pandy GroupBy z wartościami NaN (brakującymi)
Mam DataFrame z wieloma brakującymi wartościami w kolumnach, które chcę pogrupować według: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} zobacz, że Pandy porzuciły wiersze z wartościami docelowymi NaN. (Chcę uwzględnić te …

3
Wiele agregacji tej samej kolumny przy użyciu pandas GroupBy.agg ()
Czy istnieje wbudowany sposób pandy do zastosowania dwóch różnych funkcji agregujących f1, f2do tej samej kolumny df["returns"]bez konieczności agg()wielokrotnego wywoływania ? Przykładowa ramka danych: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * …


4
Połącz ciągi z kilku wierszy przy użyciu Pandas Groupby
Chcę scalić kilka ciągów w ramce danych opartej na zgrupowaniu w Pandas. To jest mój kod do tej pory: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) …

4
pandy grupa dataframe według daty i godziny
Rozważ plik CSV: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Mogę to przeczytać i przeformatować kolumnę z datą na format daty i godziny: …

9
Pandy: średnie wypełnianie brakujących wartości w każdej grupie
To powinno być proste, ale najbliższą rzeczą, jaką znalazłem, jest ten post: pandy: Uzupełnianie brakujących wartości w grupie , a nadal nie mogę rozwiązać swojego problemu .... Załóżmy, że mam następującą ramkę danych df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']}) name …

2
Jak utworzyć nową kolumnę na podstawie danych wyjściowych pandy groupby (). Sum ()?
Próbuję utworzyć nową kolumnę z groupbyobliczeń. W poniższym kodzie otrzymuję poprawne obliczone wartości dla każdej daty (patrz grupa poniżej), ale kiedy próbuję utworzyć nową kolumnę ( df['Data4']) za jej pomocą, otrzymuję NaN. Więc próbuję utworzyć nową kolumnę w ramce danych z sumą Data3wszystkich dat i zastosować ją do każdego wiersza …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.