Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

5
Dataframe Pandy pobiera pierwszy wiersz każdej grupy
Mam pandy, które DataFramelubią podążać. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Chcę to pogrupować według [„id”, „value”] i uzyskać pierwszy wiersz każdej grupy. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 first 6 3 …
150 python  pandas  dataframe 

6
Efektywny sposób na zastosowanie wielu filtrów do pand DataFrame lub Series
Mam scenariusz, w którym użytkownik chce zastosować kilka filtrów do obiektu Pandas DataFrame lub Series. Zasadniczo chcę wydajnie łączyć kilka operacji filtrowania (operacji porównania), które są określane w czasie wykonywania przez użytkownika. Filtry powinny być addytywne (każdy zastosowany powinien zawęzić wyniki). Obecnie używam, reindex()ale za każdym razem tworzy to nowy …
148 python  algorithm  pandas 

14
Pandy procent całości z grupowaniem
Jest to oczywiście proste, ale jako tępy nowicjusz utknąłem. Mam plik CSV zawierający 3 kolumny, stan, identyfikator biura i sprzedaż dla tego biura. Chcę obliczyć procent sprzedaży na biuro w danym stanie (suma wszystkich procentów w każdym stanie to 100%). df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': …
148 python  pandas 

7
pandy dataframe kolumny skalowanie za pomocą sklearn
Mam ramkę danych pandy z kolumnami typu mieszanego i chciałbym zastosować min_max_scaler sklearn do niektórych kolumn. Idealnie, chciałbym dokonać tych transformacji na miejscu, ale jeszcze nie wymyśliłem sposobu, aby to zrobić. Napisałem następujący kod, który działa: import pandas as pd import numpy as np from sklearn import preprocessing scaler = …

10
Pandy konwertują ramkę danych na tablicę krotek
Manipulowałem niektórymi danymi za pomocą pand, a teraz chcę wykonać zbiorczy zapis z powrotem do bazy danych. Wymaga to ode mnie przekształcenia ramki danych w tablicę krotek, z których każda odpowiada „wierszowi” ramki danych. Moja DataFrame wygląda mniej więcej tak: In [182]: data_set Out[182]: index data_date data_1 data_2 0 14303 …
148 python  pandas 

4
pandy pythonowe: zastosuj funkcję z argumentami do serii
Chcę zastosować funkcję z argumentami do serii w pandach Pythona: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... Dokumentacja opisuje wsparcie dla zastosowania metody, ale nie przyjmuje żadnych argumentów. Czy istnieje inna metoda, która akceptuje argumenty? Albo czy brakuje mi prostego obejścia? Aktualizacja (październik 2017 r.): Zwróć uwagę, że …
147 python  pandas  apply 

9
pandy GroupBy z wartościami NaN (brakującymi)
Mam DataFrame z wieloma brakującymi wartościami w kolumnach, które chcę pogrupować według: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} zobacz, że Pandy porzuciły wiersze z wartościami docelowymi NaN. (Chcę uwzględnić te …

2
Wybierz wiersze w pandach MultiIndex DataFrame
Jakie są najczęstsze sposoby wybierania / filtrowania wierszy ramki danych, której indeksem jest MultiIndex, na pandach ? Krojenie na podstawie jednej wartości / etykiety Krojenie na podstawie wielu etykiet z jednego lub kilku poziomów Filtrowanie według warunków i wyrażeń logicznych Jakie metody mają zastosowanie w jakich okolicznościach Założenia prostoty: wejściowa …

3
Jak zapętlić zgrupowaną ramkę danych Pandas?
Ramka danych: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Kod: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Próbuję po prostu zapętlić zagregowane dane, ale pojawia się błąd: ValueError: zbyt wiele wartości do rozpakowania @EdChum, oto oczekiwane …
146 python  pandas 

5
Jak podzielić dane na 3 zbiory (trenowanie, walidacja i testowanie)?
Mam ramkę danych pandy i chcę ją podzielić na 3 oddzielne zestawy. Wiem, że używając train_test_split z sklearn.cross_validation, można podzielić dane na dwa zestawy (pociąg i test). Nie mogłem jednak znaleźć żadnego rozwiązania dotyczącego podziału danych na trzy zestawy. Najlepiej, jeśli posiadam indeksy oryginalnych danych. Wiem, że obejściem byłoby train_test_splitdwukrotne …

7
Znajdź kolumnę, której nazwa zawiera określony ciąg
Mam ramkę danych z nazwami kolumn i chcę znaleźć tę, która zawiera określony ciąg, ale nie jest do niego dokładnie dopasowana. Szukam 'spike'w nazwy kolumn podoba 'spike-2', 'hey spike', 'spiked-in'(the 'spike'część jest zawsze ciągła). Chcę, aby nazwa kolumny była zwracana jako ciąg lub zmienna, więc mam dostęp do kolumny później …

7
Pandy dataframe fillna () tylko niektóre kolumny na miejscu
Próbuję wypełnić żadne wartości w ramce danych Pandas z zerami tylko dla niektórych podzbiorów kolumn. Kiedy robię: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Wyjście: a b c 0 1.0 4.0 NaN 1 2.0 5.0 NaN 2 3.0 NaN 7.0 3 NaN 6.0 8.0 …
145 python  pandas  dataframe 



7
Czytanie pliku Excela w Pythonie za pomocą pand
Próbuję odczytać plik Excela w ten sposób: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) co powoduje wyświetlenie błędu informującego o oczekiwaniu dwóch argumentów. Nie wiem, jaki jest drugi argument, a także to, co próbuję tutaj osiągnąć, to przekonwertować plik Excela na ramkę danych. Czy robię to we właściwy sposób? czy jest …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.