Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

5
Narysuj różne ramki DataFrames na tej samej figurze
Posiadam plik temperatur z wieloletnimi zapisami temperatur w formacie jak poniżej: 2012-04-12,16:13:09,20.6 2012-04-12,17:13:09,20.9 2012-04-12,18:13:09,20.6 2007-05-12,19:13:09,5.4 2007-05-12,20:13:09,20.6 2007-05-12,20:13:09,20.6 2005-08-11,11:13:09,20.6 2005-08-11,11:13:09,17.5 2005-08-13,07:13:09,20.6 2006-04-13,01:13:09,20.6 Każdy rok ma inne liczby, czas zapisów, więc wszystkie wskaźniki czasu i daty pand są różne. Chcę wykreślić dane z różnych lat na tej samej figurze w celu porównania. …

6
Jak dynamicznie aktualizować wykres w pętli w notatniku Ipython (w obrębie jednej komórki)
Środowisko: Python 2.7, matplotlib 1.3, IPython notebook 1.1, linux, chrome. Kod znajduje się w jednej komórce wejściowej, używając--pylab=inline Chcę używać notatnika IPython i pand, aby zużywać strumień i dynamicznie aktualizować wykres co 5 sekund. Kiedy po prostu używam instrukcji print do drukowania danych w formacie tekstowym, działa to doskonale: komórka …




4
Sortuj ramkę danych Pandas według daty
Mam następującą ramkę danych pandy: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Chcę to posortować według Date, ale kolumna to tylko plik object. Próbowałem ustawić kolumnę jako obiekt daty, ale napotkałem problem, w którym ten format nie jest wymagany. Potrzebny format to 2015-02-20,itp. Więc teraz próbuję wymyślić, w jaki …
93 python  pandas 

6
Duży, trwały DataFrame w pandach
Odkrywam przejście na Pythona i pandy jako wieloletni użytkownik SAS. Jednak podczas dzisiejszego przeprowadzania niektórych testów byłem zaskoczony, że Pythonowi zabrakło pamięci podczas próby pandas.read_csv()pliku CSV o wielkości 128 MB. Miał około 200 000 wierszy i 200 kolumn zawierających głównie dane liczbowe. Dzięki SAS mogę zaimportować plik csv do zestawu …
93 python  pandas  sas 

2
Ostrzeżenie użytkownika Python Pandas: sortowanie, ponieważ oś bez konkatenacji nie jest wyrównana
Robię trochę praktyki w kodzie i stosuję scalanie ramek danych, robiąc to, otrzymując ostrzeżenie użytkownika /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: Sortowanie, ponieważ oś niezwiązana z konkatenacją nie jest wyrównana. Przyszła wersja pand zmieni się tak, aby nie sortować domyślnie. Aby zaakceptować przyszłe zachowanie, podaj 'sort = True'. Aby zachować bieżące zachowanie i wyciszyć …
93 python  pandas 

6
Grupa pandy według sumy łącznej
Chciałbym dodać skumulowaną kolumnę sumy do mojej ramki danych Pandas, aby: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 staje się: Jack …
93 python  pandas 

4
Scalanie pand - jak uniknąć powielania kolumn
Próbuję połączyć dwie ramki danych. Każda ramka danych ma dwa poziomy indeksu (data, cusip). Na przykład niektóre kolumny w kolumnach pasują do tych dwóch (waluta, data dostosowania). Jaki jest najlepszy sposób na scalenie ich według indeksu, ale nie należy brać dwóch kopii waluty i daty dostosowania. Każda ramka danych ma …
93 python  pandas 

11
Dzielenie ramki danych na wiele ramek danych
Mam bardzo dużą ramkę danych (około 1 miliona wierszy) z danymi z eksperymentu (60 respondentów). Chciałbym podzielić ramkę danych na 60 ramek danych (po jednej dla każdego uczestnika). W ramce danych dataznajduje się zmienna o nazwie 'name', która jest unikalnym kodem dla każdego uczestnika. Próbowałem wykonać następujące czynności, ale nic …

2
Grupa Pandy według zakresu wartości
Czy w pandach istnieje łatwa metoda wywoływania groupbyz zakresu przyrostów wartości? Na przykład, biorąc pod uwagę poniższy przykład, mogę podzielić i pogrupować kolumnę Bz 0.155przyrostem, aby na przykład pierwsza para grup w kolumnie była Bpodzielona na zakresy między '0 - 0,155, 0,155 - 0,31 ...' import numpy as np import …

4
Pandy Pythona: Zachowaj wybraną kolumnę jako DataFrame zamiast Series
Po wybraniu pojedynczej kolumny z pandy DataFrame (powiedzmy df.iloc[:, 0], df['A']lub df.A, itp.), Wynikowy wektor jest automatycznie konwertowany na Series zamiast na pojedynczą kolumnę DataFrame. Jednak piszę niektóre funkcje, które przyjmują DataFrame jako argument wejściowy. Dlatego wolę zajmować się pojedynczą kolumną DataFrame zamiast Series, aby funkcja mogła założyć, że df.columns …
92 python  pandas 

4
Ładowanie pliku z więcej niż jedną linią JSON do Pandas
Próbuję wczytać w pliku JSON do ramki danych Python pandas (0.14.0). Oto pierwsza linia pliku JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandwiches and wraps are good but a little overpriced and the …

4
Połącz ciągi z kilku wierszy przy użyciu Pandas Groupby
Chcę scalić kilka ciągów w ramce danych opartej na zgrupowaniu w Pandas. To jest mój kod do tej pory: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.