Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.




5
Utworzenie pustej ramki danych Pandas, a następnie wypełnienie jej?
Zaczynam od dokumentów DataFrame pand tutaj: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Chciałbym iteracyjnie wypełnić DataFrame wartościami w rodzaju obliczeń szeregów czasowych. Zasadniczo chciałbym zainicjować ramkę danych z kolumnami A, B i wierszami znaczników czasu, wszystkie 0 lub wszystkie NaN. Następnie dodałbym wartości początkowe i przejrzałem te dane, obliczając nowy wiersz z rzędu przed, powiedzmy …
461 python  dataframe  pandas 

24
Jak policzyć wartości NaN w kolumnie w pandach DataFrame
Mam dane, w których chcę znaleźć liczbę NaN, więc jeśli jest mniejsza niż jakiś próg, upuszczę te kolumny. Spojrzałem, ale nie byłem w stanie znaleźć dla tego żadnej funkcji. istnieje value_counts, ale byłoby to dla mnie powolne, ponieważ większość wartości jest odrębna i chcę NaNtylko liczyć .
459 python  pandas  dataframe 



11
Wybierz według częściowego ciągu z pandy DataFrame
Mam DataFramez 4 kolumnami, z których 2 zawierają wartości ciągu. Zastanawiałem się, czy istnieje sposób na wybranie wierszy na podstawie częściowego dopasowania ciągu do konkretnej kolumny? Innymi słowy, funkcja lub funkcja lambda, która zrobiłaby coś podobnego re.search(pattern, cell_in_question) zwracanie wartości logicznej. Znam składnię, df[df['A'] == "hello world"]ale nie mogę znaleźć …


7
Czy uzyskać statystyki dla każdej grupy (takie jak liczba, średnia itp.) Za pomocą pand GroupBy?
Mam ramkę danych dfi używam z niej kilku kolumn do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() W powyższy sposób prawie otrzymuję potrzebną tabelę (ramkę danych). Brakuje dodatkowej kolumny, która zawiera liczbę wierszy w każdej grupie. Innymi słowy, mam na myśli, ale chciałbym również wiedzieć, ile liczb wykorzystano do uzyskania tych środków. Na przykład w …

7
Jak filtrować ramkę danych Pandas za pomocą „in” i „not in” jak w SQL
Jak mogę uzyskać odpowiedniki SQL INi NOT IN? Mam listę z wymaganymi wartościami. Oto scenariusz: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Mój obecny sposób na zrobienie tego jest następujący: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

18
UnicodeDecodeError podczas odczytu pliku CSV w Pandach z Pythonem
Korzystam z programu, który przetwarza 30 000 podobnych plików. Losowa ich liczba zatrzymuje się i wyświetla ten błąd ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …


16
Zmiana nazw kolumn ramki danych
Mam ramkę danych o nazwie „nowa cena” (patrz poniżej) i chcę zmienić nazwy kolumn w moim programie w języku R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 W rzeczywistości robię to: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Nie umieściłem tego w pętli, ponieważ …
399 r  dataframe  rename 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.