Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

11
Wybierz według częściowego ciągu z pandy DataFrame
Mam DataFramez 4 kolumnami, z których 2 zawierają wartości ciągu. Zastanawiałem się, czy istnieje sposób na wybranie wierszy na podstawie częściowego dopasowania ciągu do konkretnej kolumny? Innymi słowy, funkcja lub funkcja lambda, która zrobiłaby coś podobnego re.search(pattern, cell_in_question) zwracanie wartości logicznej. Znam składnię, df[df['A'] == "hello world"]ale nie mogę znaleźć …


7
Czy uzyskać statystyki dla każdej grupy (takie jak liczba, średnia itp.) Za pomocą pand GroupBy?
Mam ramkę danych dfi używam z niej kilku kolumn do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() W powyższy sposób prawie otrzymuję potrzebną tabelę (ramkę danych). Brakuje dodatkowej kolumny, która zawiera liczbę wierszy w każdej grupie. Innymi słowy, mam na myśli, ale chciałbym również wiedzieć, ile liczb wykorzystano do uzyskania tych środków. Na przykład w …

7
Jak filtrować ramkę danych Pandas za pomocą „in” i „not in” jak w SQL
Jak mogę uzyskać odpowiedniki SQL INi NOT IN? Mam listę z wymaganymi wartościami. Oto scenariusz: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Mój obecny sposób na zrobienie tego jest następujący: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

18
UnicodeDecodeError podczas odczytu pliku CSV w Pandach z Pythonem
Korzystam z programu, który przetwarza 30 000 podobnych plików. Losowa ich liczba zatrzymuje się i wyświetla ten błąd ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …




15
Konstruowanie pand DataFrame z wartości w zmiennych daje „ValueError: Jeśli używasz wszystkich wartości skalarnych, musisz przekazać indeks”
To może być proste pytanie, ale nie mogę wymyślić, jak to zrobić. Powiedzmy, że mam dwie zmienne w następujący sposób. a = 2 b = 3 Chcę zbudować DataFrame z tego: df2 = pd.DataFrame({'A':a,'B':b}) To generuje błąd: ValueError: Jeśli używasz wszystkich wartości skalarnych, musisz przekazać indeks Próbowałem tego także: df2 …

12
Jak zastosować funkcję do dwóch kolumn ramki danych Pandas
Załóżmy, że mam dfco ma kolumny 'ID', 'col_1', 'col_2'. I definiuję funkcję: f = lambda x, y : my_function_expression. Teraz chcę zastosować fdo df„s dwie kolumny 'col_1', 'col_2'do elementu mądry obliczy nową kolumnę 'col_3', trochę jak: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments (1 …
368 python  pandas  dataframe 

6
Wartość prawdy serii jest niejednoznaczna. Użyj a.empty, a.bool (), a.item (), a.any () lub a.all ()
Problem z filtrowaniem wynikowej ramki danych z orwarunkiem. Chcę, aby mój wynik dfwyodrębnił wszystkie varwartości kolumn powyżej 0,25 i poniżej -0,25. Ta logika poniżej daje mi dwuznaczną wartość prawdy, jednak działa, gdy podzielę filtrowanie na dwie osobne operacje. Co tu się dzieje? nie wiem, gdzie użyć sugerowanego a.empty(), a.bool(), a.item(),a.any() …

2
Pandas Scalanie 101
Jak wykonać połączenie ( LEFT| RIGHT| FULL) ( INNER| OUTER) z pandami? Jak dodać NaN dla brakujących wierszy po scaleniu? Jak pozbyć się NaN po połączeniu? Czy mogę scalić indeks? Połącz krzyżowo z pandami? Jak scalić wiele ramek danych? merge? join? concat? update? WHO? Co? Dlaczego?! ... i więcej. Widziałem …
362 python  pandas  join  merge 

2
Jak obrócić ramkę danych
Co to jest oś obrotu? Jak się obracać? Czy to jest oś obrotu? Długi format do szerokiego formatu? Widziałem wiele pytań dotyczących tabel przestawnych. Nawet jeśli nie wiedzą, że pytają o tabele przestawne, zwykle tak są. Praktycznie niemożliwe jest napisanie kanonicznego pytania i odpowiedzi, które obejmują wszystkie aspekty obrotu ... …

11
Jak uzyskać wartość z komórki ramki danych?
Skonstruowałem warunek, który wyodrębnia dokładnie jeden wiersz z mojej ramki danych: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Teraz chciałbym wziąć wartość z konkretnej kolumny: val = d2['col_name'] Ale w rezultacie otrzymuję ramkę danych, która zawiera jeden wiersz i jedną kolumnę ( tj. Jedną komórkę). Nie tego potrzebuję. …
345 python  pandas  dataframe 

30
Python Pandas Błąd tokenizacji danych
Próbuję użyć pand do manipulowania plikiem .csv, ale otrzymuję ten błąd: pandas.parser.CParserError: Błąd tokenizacji danych. Błąd C: Oczekiwano 2 pól w linii 3, patrz 12 Próbowałem czytać dokumenty pand, ale nic nie znalazłem. Mój kod jest prosty: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Jak mogę to rozwiązać? …
343 python  csv  pandas 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.