Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

4
Zastosuj vs przekształć w obiekcie grupy
Rozważmy następującą ramkę danych: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Działają następujące …
174 python  pandas 

5
pandy loc, iloc, ix, at, iat?
Niedawno zacząłem rozgałęziać się z mojego bezpiecznego miejsca (R) do Pythona i jestem trochę zdezorientowany lokalizacją / wyborem komórki w Pandas. Przeczytałem dokumentację, ale staram się zrozumieć praktyczne konsekwencje różnych opcji lokalizacji / wyboru. Czy jest jakiś powód, dla którego powinienem używać .loclub .ilocprzekraczać najbardziej ogólną opcję .ix? Rozumiem, że …

10
Jak zapisać wykres Seaborn do pliku
Wypróbowałem następujący kod ( test_seaborn.py): import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Ale pojawia się ten błąd: Traceback (most recent call last): File "test_searborn.py", line 11, in <module> fig = sns_plot.get_figure() …

8
Jak wydrukować pandy DataFrame bez indeksu
Chcę wydrukować całą ramkę danych, ale nie chcę drukować indeksu Poza tym jedna kolumna to typ daty i godziny, chcę tylko wydrukować godzinę, a nie datę. Ramka danych wygląda następująco: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 2014-07-08 00:18:00 893 2 123 2014-07-08 00:49:00 …


3
pandy: scal (połącz) dwie ramki danych w wielu kolumnach
Próbuję połączyć dwie ramki danych pandy za pomocą dwóch kolumn: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') ale pojawił się następujący błąd: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Masz jakiś pomysł, jaki powinien być właściwy …



4
Jak dodać wiersz nagłówka do pandy DataFrame
Czytam plik csv do pandas. Ten plik csv składa się z czterech kolumn i kilku wierszy, ale nie ma wiersza nagłówka, który chcę dodać. Próbowałem następujących rzeczy: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Ale kiedy stosuję kod, pojawia się następujący błąd: ValueError: Shape …
166 python  csv  pandas  header 

7
Jak wyświetlić pandy DataFrame elementów zmiennoprzecinkowych przy użyciu ciągu formatu dla kolumn?
Chciałbym wyświetlić ramkę danych pandy z podanym formatem przy użyciu print()i IPythona display(). Na przykład: df = pd.DataFrame([123.4567, 234.5678, 345.6789, 456.7890], index=['foo','bar','baz','quux'], columns=['cost']) print df cost foo 123.4567 bar 234.5678 baz 345.6789 quux 456.7890 Chciałbym jakoś zmusić to do drukowania cost foo $123.46 bar $234.57 baz $345.68 quux $456.79 bez …




6
Pandas DataFrame Groupby dwie kolumny i zliczenia
Mam ramkę danych pandy w następującym formacie: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …
165 python  pandas  dataframe 

5
Stosowanie funkcji z wieloma argumentami w celu utworzenia nowej kolumny pandy
Chcę utworzyć nową kolumnę w pandasramce danych, stosując funkcję do dwóch istniejących kolumn. Po tej odpowiedzi udało mi się utworzyć nową kolumnę, gdy potrzebuję tylko jednej kolumny jako argumentu: import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return x * x print(df) df['newcolumn'] = …
165 python  pandas 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.