Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.


8
pandy unikalne wartości wielu kolumn
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Jaki jest najlepszy sposób na zwrócenie unikatowych wartości „Col1” i „Col2”? Żądane wyjście to 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

5
Modyfikowanie podzbioru wierszy w ramce danych pandy
Załóżmy, że mam pandę DataFrame z dwiema kolumnami, A i B. Chciałbym zmodyfikować tę ramkę DataFrame (lub utworzyć kopię), aby B zawsze miało wartość NaN, gdy A wynosi 0. Jak mogę to osiągnąć? Wypróbowałem następujące df['A'==0]['B'] = np.nan i df['A'==0]['B'].values.fill(np.nan) bezskutecznie.
143 python  pandas 

10
JSON do pandy DataFrame
To, co próbuję zrobić, to wyodrębnić dane wysokości z interfejsu API map Google wzdłuż ścieżki określonej przez współrzędne szerokości i długości geograficznej w następujący sposób: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() To daje mi dane, które wyglądają następująco: elevations.splitlines() …

10
ImportError: Żaden moduł o nazwie dateutil.parser
Podczas importowania pandasdo Pythonprogramu otrzymuję następujący błąd monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File "/Library/Python/2.7/site-packages/pandas/__init__.py", …
143 python  pandas  pip 


8
Zmień nazwę indeksu Pandas DataFrame
Mam plik csv bez nagłówka z indeksem DateTime. Chcę zmienić nazwę indeksu i kolumny, ale za pomocą df.rename () zmienia się tylko nazwa kolumny. Pluskwa? Jestem na wersji 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0] ) In [3]: df.head() Out[3]: 1 0 2002-06-18 0.112000 2002-06-22 0.190333 2002-06-26 0.134000 …
142 python  pandas  dataframe 

6
Pandy: przeglądanie listy arkuszy w pliku Excel
Nowa wersja Pandas używa następującego interfejsu do ładowania plików Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) ale co, jeśli nie znam dostępnych arkuszy? Na przykład pracuję z plikami programu Excel, które znajdują się poniżej Dane 1, Dane 2 ..., Dane N, foo, bar ale nie wiem Na priori. Czy jest jakiś sposób, …
142 python  excel  pandas  openpyxl  xlrd 

6
Jak załadować plik tsv do ramki danych Pandas?
Jestem nowy w Pythonie i Pandach. Próbuję tsvzaładować plik do pandy DataFrame. Oto, co próbuję, i otrzymuję błąd: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') …
142 python  pandas  csv 

11
Zastępowanie wartości kolumn w pandach DataFrame
Próbuję zastąpić wartości w jednej kolumnie ramki danych. Kolumna („kobieta”) zawiera tylko wartości „kobieta” i „mężczyzna”. Próbowałem następujących rzeczy: w['female']['female']='1' w['female']['male']='0' Ale otrzymaj dokładnie tę samą kopię poprzednich wyników. Idealnie chciałbym uzyskać wyjście, które przypomina elementarną pętlę. if w['female'] =='female': w['female'] = '1'; else: w['female'] = '0'; Przejrzałem dokumentację gotchas …
141 python  pandas 

6
Sprawdź, czy wartość istnieje w indeksie ramki danych pandy
Jestem pewien, że jest na to oczywisty sposób, ale nie mogę teraz wymyślić nic sprytnego. Zasadniczo zamiast zgłaszać wyjątek, chciałbym uzyskać Truelub Falsesprawdzić, czy istnieje wartość w dfindeksie pand . import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) To, co teraz pracuję, jest następujące sum(df.index …
139 python  pandas  ipython 

6
Pandy read_csv z adresu url
Używam języka Python 3.4 z IPythonem i mam następujący kod. Nie mogę odczytać pliku CSV z podanego adresu URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) Mam następujący błąd „Oczekiwana nazwa ścieżki do pliku lub obiekt podobny do pliku, pobrano typ” Jak mogę to naprawić?
138 python  csv  pandas  request 

6
Pandy: Ustawienie nr. max rzędów
Mam problem z wyświetleniem następujących informacji DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Problem polega na tym, że nie drukuje domyślnie wszystkich wierszy w notatniku ipython, ale muszę ciąć, aby wyświetlić wynikowe wiersze. Nawet następująca opcja nie zmienia wyjścia: pd.set_option('display.max_rows', 500) Czy ktoś wie, jak wyświetlić …

4
Pandy Pythona: wypełnij ramkę danych wiersz po wierszu
Wydaje się, że proste zadanie dodania wiersza do pandas.DataFrameobiektu jest trudne. Istnieją 3 pytania związane z przepełnieniem stosu, z których żadne nie daje roboczej odpowiedzi. Oto, co próbuję zrobić. Mam DataFrame, której kształt już znam, a także nazwy wierszy i kolumn. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b …
138 python  dataframe  row  pandas 

6
pandy: Jak podzielić tekst w kolumnie na wiele wierszy?
Pracuję z dużym plikiem csv, a obok ostatniej kolumny znajduje się ciąg tekstu, który chcę podzielić za pomocą określonego separatora. Zastanawiałem się, czy można to zrobić w prosty sposób za pomocą pand lub Pythona? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John …
135 python  pandas  dataframe 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.