Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

12
Filtrowanie ramek danych Pandas według dat
Mam Pandas DataFrame z kolumną „data”. Teraz muszę odfiltrować wszystkie wiersze w DataFrame, które mają daty spoza najbliższych dwóch miesięcy. Zasadniczo muszę zachować tylko te wiersze, które są w ciągu najbliższych dwóch miesięcy. Jaki jest najlepszy sposób, aby to osiągnąć?

9
Jak ustalić, czy kolumna Pandas zawiera określoną wartość
Próbuję ustalić, czy w kolumnie Pandy znajduje się wpis, który ma określoną wartość. Próbowałem to zrobić if x in df['id']. Myślałem, że to działa, z wyjątkiem sytuacji, gdy podałem mu wartość, o której wiedziałem, że nie ma w kolumnie 43 in df['id'], nadal zwracała True. Kiedy podzbiorę na ramkę danych …
156 python  pandas 

6
Wyszukaj „nie zawiera” w DataFrame w pandach
Zrobiłem kilka poszukiwań i nie mogę dowiedzieć się, jak filtrować ramkę danych df["col"].str.contains(word), jednak zastanawiam się, czy istnieje sposób na odwrócenie: filtruj ramkę danych według komplementu tego zestawu. np .: z efektem !(df["col"].str.contains(word)). Czy można to zrobić DataFramemetodą?
156 python  pandas  contains 

10
pandy otrzymują średnią / średnią w kolumnie
Nie mogę uzyskać średniej lub średniej kolumny w pandach. Mają ramkę danych. Żadna z rzeczy, które wypróbowałem poniżej, nie daje mi średniej z kolumnyweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033 1963 1.3123124 3 624870 1987 0.94212 Poniższe zwraca kilka wartości, a …
155 python  pandas 




10
Znajdź indeks elementu w serii pandy
Wiem, że to bardzo podstawowe pytanie, ale z jakiegoś powodu nie mogę znaleźć odpowiedzi. Jak mogę uzyskać indeks określonego elementu serii w pandach Pythona? (wystarczyłoby pierwsze wystąpienie) To znaczy, chciałbym coś takiego: import pandas as pd myseries = pd.Series([1,4,0,7,5], index=[0,1,2,3,4]) print myseries.find(7) # should output 3 Z pewnością można zdefiniować …
154 python  pandas 

7
Pandy: suma wierszy DataFrame dla danych kolumn
Mam następującą ramkę DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Chciałbym dodać kolumnę 'e', która jest sumą kolumny 'a', 'b'i …
153 python  pandas  dataframe  sum 



3
Operatory logiczne do indeksowania wartości logicznych w Pandach
Pracuję z indeksem boolowskim w Pandach. Pytanie brzmi, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] działa dobrze, podczas gdy a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] kończy pracę z błędem? Przykład: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one …

8
Czy pandy mogą automatycznie rozpoznawać daty?
Dziś pozytywnie zaskoczył mnie fakt, że pandy odczytując dane z pliku danych (np.) Potrafią rozpoznać typy wartości: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Przykładowo można to sprawdzić w ten sposób: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) W szczególności liczby całkowite, zmiennoprzecinkowe i łańcuchy zostały poprawnie rozpoznane. Jednak mam …
151 python  date  types  dataframe  pandas 

3
Pandy tworzą puste ramki DataFrame zawierające tylko nazwy kolumn
Mam dynamiczną ramkę DataFrame, która działa dobrze, ale gdy nie ma żadnych danych do dodania do ramki DataFrame, pojawia się błąd. Dlatego potrzebuję rozwiązania, aby utworzyć pustą ramkę DataFrame z tylko nazwami kolumn. Na razie mam coś takiego: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. …
151 python  pandas  dataframe 

12
Zastępowanie pustych wartości (spacji) NaN w pandach
Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 …
150 python  pandas  dataframe 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.