Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

6
Indeks dostępu do ostatniego elementu w ramce danych
Rozglądam się za tym, ale wydaje mi się, że nie mogę go znaleźć (choć musi być niezwykle trywialne). Problem, który mam, polega na tym, że chciałbym pobrać wartość kolumny dla pierwszego i ostatniego wpisu ramki danych. Ale jeśli to zrobię: df.ix[0]['date'] Dostaję: datetime.datetime(2011, 1, 10, 16, 0) ale jeśli to …
84 python  pandas 


2
Jak utworzyć nową kolumnę na podstawie danych wyjściowych pandy groupby (). Sum ()?
Próbuję utworzyć nową kolumnę z groupbyobliczeń. W poniższym kodzie otrzymuję poprawne obliczone wartości dla każdej daty (patrz grupa poniżej), ale kiedy próbuję utworzyć nową kolumnę ( df['Data4']) za jej pomocą, otrzymuję NaN. Więc próbuję utworzyć nową kolumnę w ramce danych z sumą Data3wszystkich dat i zastosować ją do każdego wiersza …


5
Wiele wyjść komórki IPython Notebook
Uruchamiam tę komórkę w notatniku IPython: # salaries and teams are Pandas dataframe salaries.head() teams.head() W rezultacie otrzymuję dane wyjściowe tylko teamsramki danych, a nie obu salariesi teams. Jeśli po prostu uruchomię salaries.head(), otrzymam wynik dla salariesramki danych, ale po uruchomieniu obu instrukcji widzę tylko wynik teams.head(). Jak mogę to …

6
Jak połączyć serię i ramkę DataFrame
Jeśli przyszedłeś tutaj, szukając informacji na temat łączenia znaków DataFramei Seriesw indeksie , spójrz na tę odpowiedź . Pierwotnym zamiarem PO było zapytanie, jak przypisać elementy serii jako kolumny do innej ramki DataFrame . Jeśli chcesz poznać odpowiedź na to pytanie, spójrz na odpowiedź zaakceptowaną przez EdChum. Najlepsze, co mogę …

5
Python Pandas Jak przypisać wyniki operacji grupowania z powrotem do kolumn w nadrzędnej ramce danych?
Mam następującą ramkę danych w IPythonie, gdzie każdy wiersz jest pojedynczą akcją: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210 non-null values MarketCap 21210 non-null values PriceReturn 21210 non-null values SEDOL 21210 non-null values …

5
Jak pogrupować wpisy DataFrame pandy według daty w nieunikalnej kolumnie
Pandy DataFramezawiera kolumnę o nazwie, "date"która zawiera nieunikalne datetimewartości. Mogę pogrupować linie w tej ramce za pomocą: data.groupby(data['date']) Jednak powoduje to podział danych według datetimewartości. Chciałbym pogrupować te dane według roku zapisanego w kolumnie „data”. Ta strona pokazuje, jak grupować według roku w przypadkach, gdy znacznik czasu jest używany jako …
82 python  pandas 


3
Konstruuj pandy DataFrame z listy krotek (row, col, values)
Mam listę takich krotek data = [ ('r1', 'c1', avg11, stdev11), ('r1', 'c2', avg12, stdev12), ('r2', 'c1', avg21, stdev21), ('r2', 'c2', avg22, stdev22) ] i chciałbym umieścić je w pandach DataFrame z wierszami nazwanymi przez pierwszą kolumnę i kolumnami nazwanymi przez drugą kolumnę. Wygląda na to, że sposób dbania o …

2
Pandy to_html () obcina zawartość ciągu
Mam obiekt Python Pandas DataFramezawierający dane tekstowe. Mój problem polega na tym, że kiedy używamto_html() funkcji, obcina ona ciągi w danych wyjściowych. Na przykład: import pandas df = pandas.DataFrame({'text': ['Lorem ipsum dolor sit amet, consectetur adipiscing elit.']}) print (df.to_html()) Dane wyjściowe są obcinane w adapis... <table border="1" class="dataframe"> <thead> <tr …
81 python  html  pandas 

3
Usuń NaN z serii pand
Czy istnieje sposób na usunięcie wartości NaN z serii pandy? Mam serię, która może zawierać pewne wartości NaN lub nie, i chciałbym zwrócić kopię serii z usuniętymi wszystkimi NaN.
81 python  pandas  series 


3
Wydajność Pand stosuje się w porównaniu z np.vectorize do tworzenia nowej kolumny z istniejących kolumn
Używam ramek danych Pandas i chcę utworzyć nową kolumnę jako funkcję istniejących kolumn. Nie widziałem dobrej dyskusji na temat różnicy prędkości między df.apply()i np.vectorize(), więc pomyślałem, że zapytam tutaj. Funkcja Pandy apply()jest powolna. Z tego, co zmierzyłem (pokazane poniżej w niektórych eksperymentach), użycie np.vectorize()jest 25 razy szybsze (lub więcej) niż …

4
Fabuła Pand nie jest wyświetlana
Kiedy używasz tego w skrypcie (nie IPythonie), nic się nie dzieje, tj. Okno wykresu nie pojawia się: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Nawet przy dodawaniu time.sleep(5)wciąż nic nie ma. Czemu? Czy jest na to sposób, bez konieczności ręcznego wywoływania matplotlib ?

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.