Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.



14
Jak rozebrać (rozbić) kolumnę w DataFrame pandy?
Mam następujący DataFrame, w którym jedna z kolumn jest obiektem (komórka typu listy): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Oczekiwany wynik to: A B 0 1 1 1 1 2 3 2 1 4 2 2 Co mam zrobić, żeby to osiągnąć? Powiązane …
121 python  pandas  dataframe 

11
Jak pisać do istniejącego pliku Excela bez nadpisywania danych (używając pand)?
Używam pand, aby pisać do pliku Excela w następujący sposób: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx zawiera już kilka różnych zakładek. Jednak nie zawiera jeszcze „Main”. Pandy poprawnie zapisują do arkusza "Głównego", niestety kasują też wszystkie inne zakładki.

4
pandy konwertują niektóre kolumny na wiersze
Więc mój zbiór danych zawiera pewne informacje według lokalizacji dla n dat. Problem polega na tym, że każda data jest w rzeczywistości innym nagłówkiem kolumny. Na przykład CSV wygląda jak location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Chciałbym, żeby to wyglądało location …
120 python  pandas 

1
Jakich reguł używa Pandy do generowania widoku, a jakich kopii?
Jestem zdezorientowany regułami używanymi przez Pandas, gdy decyduję, że wybór z ramki danych jest kopią oryginalnej ramki danych lub widokiem oryginału. Jeśli mam na przykład df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Rozumiem, że queryzwraca kopię tak, że coś podobnego foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 nie będzie …

8
Przekazano wektor-kolumnę y, gdy oczekiwano tablicy 1d
Muszę zmieścić RandomForestRegressorod sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Ten kod zawsze działał, dopóki nie wykonałem wstępnego przetwarzania danych ( train_y). Komunikat o błędzie mówi: DataConversionWarning: przekazano wektor-kolumnę y, gdy oczekiwano tablicy 1d. Zmień kształt y na (n_samples,), na przykład za pomocą ravel (). model …

3
Jak sprawdzić, czy ciąg zawiera jeden z podciągów na liście w pandach?
Czy jest jakaś funkcja, która byłaby odpowiednikiem kombinacji df.isin()i df[col].str.contains()? Na przykład, powiedzmy, że mam serię s = pd.Series(['cat','hat','dog','fog','pet'])i chcę znaleźć wszystkie miejsca, w których szawiera którekolwiek z ['og', 'at'], chciałbym uzyskać wszystko oprócz „zwierzaka”. Mam rozwiązanie, ale jest raczej nieeleganckie: searchfor = ['og', 'at'] found = [s.str.contains(x) for x …


7
Jak usunąć ostatni wiersz danych z ramki danych pandy
Myślę, że to powinno być proste, ale wypróbowałem kilka pomysłów i żaden z nich nie zadziałał: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Próbowałem używać wskaźników ujemnych, ale to również prowadziło do błędów. Nadal nie rozumiem czegoś podstawowego.
119 python  pandas 

3
Jak powstrzymać ostrzeżenie Pandas Future?
Kiedy uruchamiam program, Pandas za każdym razem wyświetla „Ostrzeżenie o przyszłości”, jak poniżej. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Otrzymałem wiadomość, ale chcę po prostu zatrzymać wyświetlanie takiej wiadomości przez Pandy. Czy jest jakiś parametr buildin, który mogę …

6
Ignorowanie NaNs za pomocą str.contains
Chcę znaleźć wiersze zawierające ciąg, na przykład: DF[DF.col.str.contains("foo")] Jednak to się nie udaje, ponieważ niektóre elementy są NaN: Błąd wartości: nie można indeksować wektorem zawierającym wartości NA / NaN Więc uciekam się do zaciemnionego DF[DF.col.notnull()][DF.col.dropna().str.contains("foo")] Czy jest lepszy sposób?
117 python  pandas 

4
Właściwy sposób na odwrócenie pandy.DataFrame?
Oto mój kod: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Po uruchomieniu tego kodu pojawia się następujący błąd: Traceback (most recent call last): File "C:\Python33\lib\site-packages\pandas\core\generic.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: Traceback …
117 python  pandas  reverse 


9
Wydrukuj bardzo długi ciąg w całości w ramce danych pandy
Zmagam się z pozornie bardzo prostą rzeczą, mam ramkę danych pandy zawierającą bardzo długi ciąg. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Teraz, gdy próbuję wydrukować to samo, nie widzę całego ciągu, widzę raczej tylko część ciągu. …
116 python  string  pandas  options 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.