Programowanie pandas

4

Zastosuj vs przekształć w obiekcie grupy

Rozważmy następującą ramkę danych: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Działają następujące …

174 python pandas

5

pandy loc, iloc, ix, at, iat?

Niedawno zacząłem rozgałęziać się z mojego bezpiecznego miejsca (R) do Pythona i jestem trochę zdezorientowany lokalizacją / wyborem komórki w Pandas. Przeczytałem dokumentację, ale staram się zrozumieć praktyczne konsekwencje różnych opcji lokalizacji / wyboru. Czy jest jakiś powód, dla którego powinienem używać .loclub .ilocprzekraczać najbardziej ogólną opcję .ix? Rozumiem, że …

171 python pandas performance indexing lookup

10

Jak zapisać wykres Seaborn do pliku

Wypróbowałem następujący kod ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Ale pojawia się ten błąd: Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = sns_plot.get_figure() …

171 python pandas matplotlib seaborn

8

Jak wydrukować pandy DataFrame bez indeksu

Chcę wydrukować całą ramkę danych, ale nie chcę drukować indeksu Poza tym jedna kolumna to typ daty i godziny, chcę tylko wydrukować godzinę, a nie datę. Ramka danych wygląda następująco: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 2014-07-08 00:49:00 …

170 python datetime pandas dataframe

7

Jak filtrować wiersze w pandach według wyrażenia regularnego

Chciałbym czysto przefiltrować ramkę danych za pomocą wyrażenia regularnego w jednej z kolumn. Oto wymyślony przykład: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Chcę przefiltrować wiersze …

169 python regex pandas

3

pandy: scal (połącz) dwie ramki danych w wielu kolumnach

Próbuję połączyć dwie ramki danych pandy za pomocą dwóch kolumn: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') ale pojawił się następujący błąd: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Masz jakiś pomysł, jaki powinien być właściwy …

169 python python-3.x pandas join

5

Jaka jest różnica między serią pandy a pojedynczą kolumną DataFrame?

Dlaczego pandy rozróżniają Serieskolumnę a od pojedynczej kolumny DataFrame? Innymi słowy: jaka jest przyczyna istnienia Seriesklasy? Używam głównie szeregów czasowych z indeksem daty i godziny, może to pomaga ustawić kontekst.

168 python pandas

7

Przekonwertuj Pandas DataFrame na słownik

Mam DataFrame z czterema kolumnami. Chcę przekonwertować tę ramkę DataFrame na słownik języka Python. Chcę, aby elementy pierwszej kolumny były, keysa elementy innych kolumn w tym samym wierszu values. Ramka danych: ID A B C 0 p 1 3 2 1 q 4 3 2 2 r 4 0 9 …

168 python pandas dictionary dataframe

4

Jak dodać wiersz nagłówka do pandy DataFrame

Czytam plik csv do pandas. Ten plik csv składa się z czterech kolumn i kilku wierszy, ale nie ma wiersza nagłówka, który chcę dodać. Próbowałem następujących rzeczy: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Ale kiedy stosuję kod, pojawia się następujący błąd: ValueError: Shape …

166 python csv pandas header

7

Jak wyświetlić pandy DataFrame elementów zmiennoprzecinkowych przy użyciu ciągu formatu dla kolumn?

Chciałbym wyświetlić ramkę danych pandy z podanym formatem przy użyciu print()i IPythona display(). Na przykład: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Chciałbym jakoś zmusić to do drukowania cost foo $123.46 bar $234.57 baz $345.68 quux $456.79 bez …

166 python python-2.7 pandas ipython dataframe

5

pandy grupuj według sortowania w grupach

Chcę pogrupować moją ramkę danych według dwóch kolumn, a następnie posortować zagregowane wyniki w grupach. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 market B …

166 python sorting pandas group-by

7

Używanie Pandas do pd.read_excel () dla wielu arkuszy tego samego skoroszytu

Mam duży plik arkusza kalkulacyjnego (.xlsx), który przetwarzam za pomocą pand w języku Python. Zdarza się, że potrzebuję danych z dwóch zakładek w tym dużym pliku. Jedna z zakładek zawiera mnóstwo danych, a druga to tylko kilka kwadratowych komórek. Kiedy używam pd.read_excel () na dowolnym arkuszu, wygląda na to, że …

166 python excel pandas dataframe

12

Dzielenie słownika / listy wewnątrz kolumny Pandas na oddzielne kolumny

Mam dane zapisane w postgreSQLbazie danych. Pytam o te dane za pomocą Python2.7 i zamieniam je w Pandas DataFrame. Jednak w ostatniej kolumnie tej ramki danych znajduje się słownik (lub lista?) Wartości. DataFrame wygląda następująco: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 {"a": "36", …

166 python pandas dictionary dataframe

6

Pandas DataFrame Groupby dwie kolumny i zliczenia

Mam ramkę danych pandy w następującym formacie: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …

165 python pandas dataframe

5

Stosowanie funkcji z wieloma argumentami w celu utworzenia nowej kolumny pandy

Chcę utworzyć nową kolumnę w pandasramce danych, stosując funkcję do dwóch istniejących kolumn. Po tej odpowiedzi udało mi się utworzyć nową kolumnę, gdy potrzebuję tylko jednej kolumny jako argumentu: import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return x * x print(df) df['newcolumn'] = …

165 python pandas

Pytania otagowane jako pandas