Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.



7
Jaka jest różnica między łączeniem i łączeniem w Pandach?
Załóżmy, że mam dwie takie ramki danych: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Chcę je scalić, więc próbuję czegoś takiego: pd.merge(left, right, left_on='key1', right_on='key2') I cieszę się key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 bar …
208 python  pandas  dataframe  join 

7
Pandy grupowane i sumowane
Używam tej ramki danych: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 …

9
Zachowaj tylko datę podczas korzystania z pandas.to_datetime
Używam pandas.to_datetimedo analizowania dat w moich danych. Pandy domyślnie reprezentują daty, datetime64[ns]mimo że wszystkie są tylko codziennie. Zastanawiam się, czy istnieje elegancki / sprytny sposób na konwersję dat, datetime.dateczy też datetime64[D]tak, że kiedy piszę dane do CSV, daty nie są dołączane 00:00:00. Wiem, że mogę ręcznie przekonwertować typ element po …
201 python  pandas  csv  datetime  series 


17
Wykrywanie i wykluczanie wartości odstających w ramce danych Pandas
Mam ramkę danych pand z kilkoma kolumnami. Teraz wiem, że niektóre wiersze są wartościami odstającymi na podstawie określonej wartości kolumny. Na przykład kolumna „Vol” ma wszystkie wartości wokół, 12xxa jedna wartość to 4000(odstająca). Teraz chciałbym wykluczyć te wiersze, które mają Vol taką kolumnę. Zasadniczo więc muszę umieścić filtr w ramce …

8
Wybierz wiersze DataFrame między dwiema datami
Tworzę DataFrame z csv w następujący sposób: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame ma kolumnę daty. Czy istnieje sposób na utworzenie nowej DataFrame (lub po prostu zastąpienie istniejącej), która zawiera tylko wiersze z wartościami dat mieszczącymi się w określonym zakresie dat lub między dwiema określonymi wartościami dat?
198 python  pandas 

11
Jak podzielić kolumnę na dwie kolumny?
Mam ramkę danych z jedną kolumną i chciałbym podzielić ją na dwie kolumny, z nagłówkiem jednej kolumny jako „fips' a drugą”'row' Moja ramka danych dfwygląda następująco: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL Nie …
197 python  dataframe  pandas 

7
Dodaj etykiety xiy do wykresu pand
Załóżmy, że mam następujący kod, który drukuje coś bardzo prostego przy użyciu pand: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') Jak łatwo ustawić etykiety X i Y, …

9
Zmiana konkretnej nazwy kolumny w pandach DataFrame
Szukałem eleganckiego sposobu na zmianę określonej nazwy kolumny w DataFrame. odtwórz dane ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Najbardziej eleganckie rozwiązanie, jakie do tej pory znalazłem …
195 python  pandas 


15
Jak odczytać duży plik csv z pandami?
Próbuję odczytać duży plik csv (około 6 GB) w pandach i pojawia się błąd pamięci: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Jakaś pomoc na ten temat?
194 python  pandas  csv  memory  chunks 

10
pandy trójdrożne łączenie wielu ramek danych na kolumnach
Mam 3 pliki CSV. Każda z nich ma pierwszą kolumnę jako (ciąg) nazwisk osób, podczas gdy wszystkie pozostałe kolumny w każdej ramce danych są atrybutami tej osoby. Jak mogę „połączyć” razem wszystkie trzy dokumenty CSV, aby utworzyć pojedynczy plik CSV, w którym każdy wiersz ma wszystkie atrybuty dla każdej unikalnej …
191 python  pandas  join  merge 

1
Pandy Pythona Filtrowanie nan z selekcji danych w kolumnie ciągów
Bez użycia, groupbyjak miałbym odfiltrować dane bezNaN ? Powiedzmy, że mam matrycę, w której klienci wypełnią „nie dotyczy”, „nie dotyczy” lub dowolną z jej odmian, a inni pozostawiają to pole puste: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol', 'mol', 'lob', 'lob'], 'rating': [3., …
190 python  pandas  dataframe 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.