Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

3
Przykładowe zbiory danych w Pandach
Korzystając z języka R, przydatne jest ładowanie „ćwiczeniowych” zestawów danych za pomocą data(iris) lub data(mtcars) Czy jest coś podobnego dla Pand? Wiem, że mogę załadować inną metodą, jestem po prostu ciekawy, czy jest coś wbudowanego.



6
python pandas dataframe, czy jest to przekazywanie przez wartość, czy przekazywanie przez odniesienie
Jeśli przekażę ramkę danych do funkcji i zmodyfikuję ją wewnątrz funkcji, czy jest to przekazanie przez wartość czy przekazanie przez odwołanie? Uruchamiam następujący kod a = pd.DataFrame({'a':[1,2], 'b':[3,4]}) def letgo(df): df = df.drop('b',axis=1) letgo(a) wartość anie zmienia się po wywołaniu funkcji. Czy to oznacza, że ​​jest to wartość przekazana? Wypróbowałem …


1
Pandas timeseries kreśli kreślenie głównych i pobocznych znaczników i etykiet na osi X.
Chcę mieć możliwość ustawienia głównych i pomocniczych znaczników oraz ich etykiet dla wykresu szeregów czasowych wykreślonych z obiektu szeregów czasowych Pandas. Na stronie Pandas 0.9 „co nowego” jest napisane: „możesz użyć to_pydatetime lub zarejestrować konwerter dla typu Timestamp” ale nie wiem, jak to zrobić, aby móc używać poleceń matplotlib ax.xaxis.set_major_locatori …

5
Przesunąć kolumnę w ramce danych pand o jeden?
Mam ramkę danych pandy. Chcę „opóźnić” jedną z moich kolumn. Oznacza to, na przykład, przesunięcie całej kolumny „gdp” w górę o jeden, a następnie usunięcie wszystkich nadmiarowych danych na dole pozostałych wierszy, tak aby wszystkie kolumny były znowu równej długości. df = y gdp cap 0 1 2 5 1 …

3
Pandy: jak zmienić wszystkie wartości w kolumnie?
Mam ramkę danych z kolumną o nazwie "Date"i chcę, aby wszystkie wartości z tej kolumny miały tę samą wartość (tylko rok). Przykład: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Chcę: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Oto mój kod: fr61_70xls = pd.ExcelFile('AMADEUS FRANCE …

3
wyodrębnianie dni z wartości numpy.timedelta64
Używam pandy / python i mam dwie serie dat s1 i s2, które zostały wygenerowane za pomocą funkcji „to_datetime” w polu df zawierającym daty / godziny. Kiedy odejmuję s1 od s2 s3 = s2 - s1 Otrzymuję serię s3 typu timedelta64 [ns] 0 385 days, 04:10:36 1 57 days, 22:54:00 …
87 python  numpy  pandas 

3
Jak usunąć kolumnę zawierającą tylko zera w Pandach?
Obecnie mam ramkę danych składającą się z kolumn z 1 i 0 jako wartościami, chciałbym iterować przez kolumny i usuwać te, które składają się tylko z 0. Oto, czego próbowałem do tej pory: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == …
87 python  pandas 

5
Upuść wiersze zawierające puste komórki z pandy DataFrame
Mam plik pd.DataFrameutworzony przez analizę niektórych arkuszy kalkulacyjnych programu Excel. Kolumna zawierająca puste komórki. Na przykład poniżej przedstawiono dane wyjściowe dla częstotliwości tej kolumny, w 32320 rekordach brakuje wartości dla dzierżawcy . >>> value_counts(Tenant, normalize=False) 32320 Thunderhead 8170 Big Data Others 5700 Cloud Cruiser 5700 Partnerpedia 5700 Comcast 5700 SDP …
87 python  pandas 

1
Zastosuj funkcję do każdej komórki w DataFrame
Mam ramkę danych, która może wyglądać następująco: A B C foo bar foo bar bar foo foo bar Chcę przejrzeć każdy element każdego wiersza (lub każdy element każdej kolumny) i zastosować następującą funkcję, aby uzyskać kolejny DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar …

9
Pandy: średnie wypełnianie brakujących wartości w każdej grupie
To powinno być proste, ale najbliższą rzeczą, jaką znalazłem, jest ten post: pandy: Uzupełnianie brakujących wartości w grupie , a nadal nie mogę rozwiązać swojego problemu .... Załóżmy, że mam następującą ramkę danych df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': ['A','A', 'B','B','B','B', 'C','C','C']}) name …


9
Jak zapisać nowy arkusz w istniejącym pliku Excela za pomocą Pand?
Chcę używać plików programu Excel do przechowywania danych opracowanych w Pythonie. Mój problem polega na tym, że nie mogę dodać arkuszy do istniejącego pliku Excela. Tutaj proponuję przykładowy kod do pracy w celu rozwiązania tego problemu import pandas as pd import numpy as np path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" x1 = np.random.randn(100, …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.