Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

1
Seaborn pokazujący notację naukową na mapie cieplnej dla liczb 3-cyfrowych
Tworzę mapę cieplną z tabeli pandas pivot_table, jak poniżej: table2 = pd.pivot_table(df,values='control',columns='Year',index='Region',aggfunc=np.sum) sns.heatmap(table2,annot=True,cmap='Blues') Tworzy mapę cieplną, jak pokazano poniżej. Widać, że liczby nie są ogromne (maksymalnie 750), ale pokazuje je w notacji naukowej. Jeśli patrzę na sam stół, tak nie jest. Masz jakiś pomysł, jak mogę sprawić, by pokazywały liczby …

8
Podziel dużą ramkę danych pandy
Mam dużą ramkę danych z 423244 liniami. Chcę podzielić to na 4. Próbowałem następującego kodu, który dał błąd?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Jak podzielić tę ramkę danych na 4 grupy?
86 python  pandas 

13
ValueError: numpy.dtype ma nieprawidłowy rozmiar, spróbuj ponownie skompilować
Właśnie zainstalowałem pakiet pandy i statsmodels na moim Pythonie 2.7. Kiedy próbowałem „zaimportować pandy jako pd”, pojawia się ten komunikat o błędzie. Czy ktoś może pomóc? Dzięki!!! numpy.dtype has the wrong size, try recompiling Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\analytics\ext\python27\lib\site-packages\statsmodels-0.5.0-py2.7-win32.egg\statsmodels\formula\__init__.py", line 4, in …

3
Połącz dwie pandy Data Frames (połącz we wspólnej kolumnie)
Mam 2 ramki danych: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null values …

6
Pandy: konwertuj kategorie na liczby
Załóżmy, że mam ramkę danych z krajami, które są następujące: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Wiem, że istnieje funkcja pd.get_dummies służąca do konwersji krajów na „kodowanie na jeden gorący”. Chciałbym jednak przekonwertować je na indeksy zamiast takich, które otrzymam cc_index …

6
pandy: złożony filtr w wierszach DataFrame
Chciałbym filtrować wiersze według funkcji każdego wiersza, np def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] Albo inny, bardziej złożony, wymyślony przykład, def g(row): if row['col1'].method1() == 1: val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4']) else: val = row['col2'].method5(row['col6']) return np.sin(val) df = pandas.DataFrame(...) filtered = …
85 python  pandas 

3
Jak nadać wykresowi słupkowemu pandy / matplotlib niestandardowe kolory
Właśnie zacząłem używać pandas / matplotlib jako zamiennika programu Excel do generowania skumulowanych wykresów słupkowych. Mam problem (1) w domyślnej mapie kolorów jest tylko 5 kolorów, więc jeśli mam więcej niż 5 kategorii, kolory się powtarzają. Jak mogę określić więcej kolorów? Idealnie, gradient z kolorem początkowym i końcowym oraz sposób …

8
Pandy: średnia krocząca według przedziału czasu
Jestem nowy w Pandas… Mam mnóstwo danych z ankiet; Chcę obliczyć średnią kroczącą, aby uzyskać oszacowanie dla każdego dnia na podstawie trzydniowego okna. Jak rozumiem z tego pytania , funkcje rolling_ * obliczają okno na podstawie określonej liczby wartości, a nie określonego zakresu dat i godzin. Czy istnieje inna funkcja, …

2
Jak ustawić niektóre xlim i ylim w Seaborn lmplot facetgrid
Używam lmplot Seaborna do wykreślenia regresji liniowej, dzieląc mój zestaw danych na dwie grupy ze zmienną kategorialną. Zarówno dla x, jak i y, chciałbym ręcznie ustawić dolną granicę na obu wykresach, ale górną granicę zostawić jako domyślną Seaborn. Oto prosty przykład: import pandas as pd import seaborn as sns import …
85 python  pandas  seaborn 

6
Różnica (y) między merge () i concat () w pandach
Jaka jest zasadnicza różnica (y) między pd.DataFrame.merge()i pd.concat()? Jak dotąd znalazłem to, proszę o komentarz, jak kompletne i dokładne jest moje zrozumienie: .merge()może używać tylko kolumn (plus indeksów wierszy) i jest semantycznie odpowiedni dla operacji w stylu bazy danych. .concat()może być używany z każdą osią, używając tylko indeksów, i daje …
85 python  pandas  join  merge  concat 

3
Oblicz różnicę czasu Pandas DataFrame między dwiema kolumnami w godzinach i minutach
Mam dwie kolumny fromdatei todatew ramce danych. import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data) Dodaję nową kolumnę, diffaby znaleźć różnicę między dwiema datami za pomocą df['diff'] = df['fromdate'] - df['todate'] Dostaję diffkolumnę, ale zawiera …

5
Dodaj tablicę numpy jako kolumnę do ramki danych Pandas
Mam obiekt ramki danych Pandy w kształcie (X, Y), który wygląda następująco: [[1, 2, 3], [4, 5, 6], [7, 8, 9]] i numpy rzadkiej macierzy (CSC) w kształcie (X, Z), która wygląda mniej więcej tak [[0, 1, 0], [0, 0, 1], [1, 0, 0]] Jak mogę dodać zawartość z macierzy …
85 python  numpy  pandas 

2
zapisz pandas.Series histogram plot do pliku
W ipython Notebook najpierw utwórz obiekt serii pandy, a następnie wywołując metodę instancji .hist (), przeglądarka wyświetli figurę. Zastanawiam się jak zapisać tę figurę do pliku (mam na myśli nie kliknięcie prawym przyciskiem i zapisanie jako, ale polecenia potrzebne w skrypcie).

2
Python - wymiar ramki danych
Nowość w Pythonie. W R możesz uzyskać wymiar macierzy za pomocą dim (...). Jaka jest odpowiednia funkcja w Python Pandas dla ich ramki danych?
85 python  pandas 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.