Programowanie dataframe

20

Ustaw wartość dla konkretnej komórki w pandach DataFrame za pomocą indeksu

Stworzyłem Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) i mam to xy NaN NaN B NaN NaN C NaN NaN Następnie chcę przypisać wartość do konkretnej komórki, na przykład dla wiersza „C” i kolumny „x”. Spodziewałem się takiego wyniku: xy NaN NaN B NaN NaN C 10 NaN z tym kodem: …

477 python pandas dataframe

10

Różnica między mapą, mapą aplikacji i metodami zastosowania w Pandach

Czy możesz mi powiedzieć, kiedy stosować te metody wektoryzacji w podstawowych przykładach? Widzę, że mapjest to Seriesmetoda, podczas gdy reszta to DataFramemetody. Miałem jednak wątpliwości applyi applymapmetody. Dlaczego mamy dwie metody zastosowania funkcji do DataFrame? Ponownie proste przykłady ilustrujące użycie byłyby świetne!

465 python pandas dataframe vectorization

15

Konwertuj ramkę danych pandy na tablicę NumPy

Jestem zainteresowany wiedzą, jak przekonwertować ramkę danych pandy na tablicę NumPy. ramka danych: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = …

465 python arrays pandas numpy dataframe

5

Utworzenie pustej ramki danych Pandas, a następnie wypełnienie jej?

Zaczynam od dokumentów DataFrame pand tutaj: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Chciałbym iteracyjnie wypełnić DataFrame wartościami w rodzaju obliczeń szeregów czasowych. Zasadniczo chciałbym zainicjować ramkę danych z kolumnami A, B i wierszami znaczników czasu, wszystkie 0 lub wszystkie NaN. Następnie dodałbym wartości początkowe i przejrzałem te dane, obliczając nowy wiersz z rzędu przed, powiedzmy …

461 python dataframe pandas

24

Jak policzyć wartości NaN w kolumnie w pandach DataFrame

Mam dane, w których chcę znaleźć liczbę NaN, więc jeśli jest mniejsza niż jakiś próg, upuszczę te kolumny. Spojrzałem, ale nie byłem w stanie znaleźć dla tego żadnej funkcji. istnieje value_counts, ale byłoby to dla mnie powolne, ponieważ większość wartości jest odrębna i chcę NaNtylko liczyć .

459 python pandas dataframe

12

Jak mogę zastąpić wszystkie wartości NaN zerami w kolumnie ramki danych pandy

Mam ramkę danych, jak poniżej itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 485 …

457 python pandas dataframe

7

Jak przekonwertować indeks ramki danych pandy na kolumnę?

Wydaje się to dość oczywiste, ale nie potrafię wymyślić, jak przekonwertować indeks ramki danych na kolumnę? Na przykład: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 Do, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

456 python pandas dataframe

11

Wybierz według częściowego ciągu z pandy DataFrame

Mam DataFramez 4 kolumnami, z których 2 zawierają wartości ciągu. Zastanawiałem się, czy istnieje sposób na wybranie wierszy na podstawie częściowego dopasowania ciągu do konkretnej kolumny? Innymi słowy, funkcja lub funkcja lambda, która zrobiłaby coś podobnego re.search(pattern, cell_in_question) zwracanie wartości logicznej. Znam składnię, df[df['A'] == "hello world"]ale nie mogę znaleźć …

448 python string pandas dataframe

9

Losuj wiersze DataFrame

Mam następujące DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame jest odczytywany z pliku csv. Wszystkie wiersze, które mają …

438 python pandas dataframe permutation shuffle

7

Czy uzyskać statystyki dla każdej grupy (takie jak liczba, średnia itp.) Za pomocą pand GroupBy?

Mam ramkę danych dfi używam z niej kilku kolumn do groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() W powyższy sposób prawie otrzymuję potrzebną tabelę (ramkę danych). Brakuje dodatkowej kolumny, która zawiera liczbę wierszy w każdej grupie. Innymi słowy, mam na myśli, ale chciałbym również wiedzieć, ile liczb wykorzystano do uzyskania tych środków. Na przykład w …

438 python pandas dataframe group-by pandas-groupby

7

Jak filtrować ramkę danych Pandas za pomocą „in” i „not in” jak w SQL

Jak mogę uzyskać odpowiedniki SQL INi NOT IN? Mam listę z wymaganymi wartościami. Oto scenariusz: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Mój obecny sposób na zrobienie tego jest następujący: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

432 python pandas dataframe sql-function

18

UnicodeDecodeError podczas odczytu pliku CSV w Pandach z Pythonem

Korzystam z programu, który przetwarza 30 000 podobnych plików. Losowa ich liczba zatrzymuje się i wyświetla ten błąd ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …

411 python pandas csv dataframe unicode

15

Zaimportuj wiele plików csv do pand i połącz w jedną ramkę danych

Chciałbym odczytać kilka plików csv z katalogu do pand i połączyć je w jedną dużą ramkę danych. Nie byłem jednak w stanie tego rozgryźć. Oto co mam do tej pory: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = …

403 python pandas csv dataframe concatenation

16

Zmiana nazw kolumn ramki danych

Mam ramkę danych o nazwie „nowa cena” (patrz poniżej) i chcę zmienić nazwy kolumn w moim programie w języku R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 W rzeczywistości robię to: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Nie umieściłem tego w pętli, ponieważ …

399 r dataframe rename

6

Wybór rzędu serii pand / ramki danych według indeksu liczb całkowitych

Jestem ciekawy, dlaczego df[2]nie jest obsługiwany, podczas gdy df.ix[2]i df[2:3]oba działają. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Spodziewałbym się, że będę df[2]działał w taki sam sposób, df[2:3]aby zachować …

395 python pandas dataframe indexing

Pytania otagowane jako dataframe