Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.


6
Jak mogę filtrować linie podczas ładowania w funkcji read_csv Pandas?
Jak mogę filtrować, które wiersze pliku CSV mają zostać załadowane do pamięci za pomocą pand? Wydaje się, że jest to opcja, którą należy znaleźć read_csv. Czy coś mi brakuje? Przykład: mamy plik CSV z kolumną znacznika czasu i chcielibyśmy załadować tylko wiersze, które mają znacznik czasu większy niż dana stała.
100 python  pandas 

12
Jak zaimportować dane z mongodb do pandy?
Mam dużą ilość danych w kolekcji w mongodb, które muszę przeanalizować. Jak zaimportować te dane do pand? Jestem nowy w pandach i odrętwiały. EDYCJA: Kolekcja mongodb zawiera wartości czujników oznaczone datą i godziną. Wartości czujnika są typu float. Przykładowe dane: { "_cls" : "SensorReport", "_id" : ObjectId("515a963b78f6a035d9fa531b"), "_types" : [ …

6
Pomiń wiersze podczas importu csv
Próbuję zaimportować plik .csv za pomocą pandas.read_csv(), ale nie chcę importować drugiego wiersza pliku danych (wiersz z indeksem = 1 dla indeksowania 0). Nie widzę, jak go nie importować, ponieważ argumenty użyte w poleceniu wydają się niejednoznaczne: Ze strony pandy: skiprows : lista lub liczba całkowita Numery wierszy do pominięcia …
99 python  csv  pandas 

6
Jak obracać etykiety znaczników osi X w wykresie słupkowym Pandas
Z następującym kodem: import matplotlib matplotlib.style.use('ggplot') import matplotlib.pyplot as plt import pandas as pd df = pd.DataFrame({ 'celltype':["foo","bar","qux","woz"], 's1':[5,9,1,7], 's2':[12,90,13,87]}) df = df[["celltype","s1","s2"]] df.set_index(["celltype"],inplace=True) df.plot(kind='bar',alpha=0.75) plt.xlabel("") Zrobiłem ten spisek: Jak mogę obrócić etykiety znaczników osi X o 0 stopni? Próbowałem to dodać, ale nie zadziałało: plt.set_xticklabels(df.index,rotation=90)

6
Jak przekazać kolejną całą kolumnę jako argument do pandy fillna ()
Chciałbym uzupełnić brakujące wartości w jednej kolumnie wartościami z innej kolumny, używając fillnametody. (Czytałem, że zapętlanie każdego wiersza byłoby bardzo złą praktyką i że lepiej byłoby zrobić wszystko za jednym razem, ale nie mogłem się dowiedzieć, jak to zrobić fillna.) Dane przed: Day Cat1 Cat2 1 cat mouse 2 dog …
99 python  pandas  fillna 

7
Jak ustawić komórkę na NaN w ramce danych pandy
Chciałbym zamienić złe wartości w kolumnie ramki danych na wartości NaN. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Chociaż ostatnia linia zawodzi i generuje ostrzeżenie, ponieważ działa na kopii df. Więc …
98 python  pandas  nan 


5
pandy read_csv i filtruj kolumny za pomocą usecols
Mam plik csv, który nie przychodzi poprawnie, pandas.read_csvgdy filtruję kolumny usecolsi używam wielu indeksów. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", "x"], parse_dates=["date"]) print df1 …

5
Jaka jest różnica między NaN i None?
Czytam dwie kolumny pliku csv za pomocą pand, readcsv()a następnie przypisuję wartości do słownika. Kolumny zawierają ciągi cyfr i liter. Czasami zdarzają się przypadki, gdy komórka jest pusta. Moim zdaniem wartość odczytywana dla tego hasła w słowniku powinna być, Noneale zamiast tego nanjest przypisywana. Z pewnością Nonejest bardziej opisowy dla …
98 python  numpy  pandas  nan 


5
Dodaj kolumnę w ramce danych z listy
Mam ramkę danych z kilkoma kolumnami takimi jak ta: A B C 0 4 5 6 7 7 6 5 Dopuszczalny zakres wartości w tylko od 0 do 7 . Mam też listę 8 elementów, takich jak ta: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Jeśli element w …

7
Pandy Jak filtrować serię
Mam taką serię po wykonaniu funkcji Groupby („name”) i użyciu funkcji mean () w innej kolumnie name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Czy ktoś mógłby mi pokazać, jak odfiltrować wiersze z wartościami średnimi 1,000000? Dziękuję i bardzo doceniam twoją pomoc.
98 python  pandas 

13
python-pandy i bazy danych, takie jak mysql
Dokumentacja Pandas zawiera wiele przykładów najlepszych praktyk dotyczących pracy z danymi przechowywanymi w różnych formatach. Nie mogę jednak znaleźć żadnych dobrych przykładów pracy z bazami danych, takimi jak na przykład MySQL. Czy ktoś może wskazać mi linki lub podać fragmenty kodu, jak wydajnie konwertować wyniki zapytań za pomocą mysql-python na …
97 python  pandas 

4
Tabela częstotliwości dla jednej zmiennej
Ostatnie pytanie dotyczące pandy dla początkujących na ten dzień: Jak wygenerować stół dla jednej serii? Na przykład: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Dużo googlowania doprowadziło mnie do Series.describe () i pandas.crosstabs, ale żadna z nich nie robi …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.