Programowanie pandas

11

Powiedzmy, że dfjest to DataFrame pandy. Chciałbym znaleźć wszystkie kolumny typu liczbowego. Coś jak: isNumeric = is_numeric(df)

121 python types pandas

11

Znajdź maksymalną wartość kolumny i zwróć odpowiednie wartości wierszy za pomocą Pandas

Używając Python Pandas próbuję znaleźć Country& Placeo maksymalnej wartości. Zwraca maksymalną wartość: data.groupby(['Country','Place'])['Value'].max() Ale jak mogę uzyskać odpowiedni Countryi Placenazwę?

121 python pandas dataframe max

14

Jak rozebrać (rozbić) kolumnę w DataFrame pandy?

Mam następujący DataFrame, w którym jedna z kolumn jest obiektem (komórka typu listy): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Oczekiwany wynik to: A B 0 1 1 1 1 2 3 2 1 4 2 2 Co mam zrobić, żeby to osiągnąć? Powiązane …

121 python pandas dataframe

11

Jak pisać do istniejącego pliku Excela bez nadpisywania danych (używając pand)?

Używam pand, aby pisać do pliku Excela w następujący sposób: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx zawiera już kilka różnych zakładek. Jednak nie zawiera jeszcze „Main”. Pandy poprawnie zapisują do arkusza "Głównego", niestety kasują też wszystkie inne zakładki.

120 python excel python-2.7 pandas

4

pandy konwertują niektóre kolumny na wiersze

Więc mój zbiór danych zawiera pewne informacje według lokalizacji dla n dat. Problem polega na tym, że każda data jest w rzeczywistości innym nagłówkiem kolumny. Na przykład CSV wygląda jak location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Chciałbym, żeby to wyglądało location …

120 python pandas

1

Jakich reguł używa Pandy do generowania widoku, a jakich kopii?

Jestem zdezorientowany regułami używanymi przez Pandas, gdy decyduję, że wybór z ramki danych jest kopią oryginalnej ramki danych lub widokiem oryginału. Jeśli mam na przykład df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Rozumiem, że queryzwraca kopię tak, że coś podobnego foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 nie będzie …

119 python pandas dataframe indexing chained-assignment

8

Przekazano wektor-kolumnę y, gdy oczekiwano tablicy 1d

Muszę zmieścić RandomForestRegressorod sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Ten kod zawsze działał, dopóki nie wykonałem wstępnego przetwarzania danych ( train_y). Komunikat o błędzie mówi: DataConversionWarning: przekazano wektor-kolumnę y, gdy oczekiwano tablicy 1d. Zmień kształt y na (n_samples,), na przykład za pomocą ravel (). model …

119 python pandas numpy scikit-learn

3

Jak sprawdzić, czy ciąg zawiera jeden z podciągów na liście w pandach?

Czy jest jakaś funkcja, która byłaby odpowiednikiem kombinacji df.isin()i df[col].str.contains()? Na przykład, powiedzmy, że mam serię s = pd.Series(['cat','hat','dog','fog','pet'])i chcę znaleźć wszystkie miejsca, w których szawiera którekolwiek z ['og', 'at'], chciałbym uzyskać wszystko oprócz „zwierzaka”. Mam rozwiązanie, ale jest raczej nieeleganckie: searchfor = ['og', 'at'] found = [s.str.contains(x) for x …

119 python string pandas dataframe match

5

dodaj prefiks ciągu do każdej wartości w kolumnie ciągów przy użyciu Pandas

Chciałbym dołączyć ciąg na początku każdej wartości we wspomnianej kolumnie ramki danych pandy (elegancko). Dowiedziałem się już, jak to zrobić i obecnie używam: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Wydaje się to cholernie nieeleganckie - czy znasz inny sposób (który może również dodaje znak do wierszy, w …

119 python string pandas dataframe

7

Jak usunąć ostatni wiersz danych z ramki danych pandy

Myślę, że to powinno być proste, ale wypróbowałem kilka pomysłów i żaden z nich nie zadziałał: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Próbowałem używać wskaźników ujemnych, ale to również prowadziło do błędów. Nadal nie rozumiem czegoś podstawowego.

119 python pandas

3

Jak powstrzymać ostrzeżenie Pandas Future?

Kiedy uruchamiam program, Pandas za każdym razem wyświetla „Ostrzeżenie o przyszłości”, jak poniżej. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Otrzymałem wiadomość, ale chcę po prostu zatrzymać wyświetlanie takiej wiadomości przez Pandy. Czy jest jakiś parametr buildin, który mogę …

118 python pandas suppress-warnings future-warning

6

Ignorowanie NaNs za pomocą str.contains

Chcę znaleźć wiersze zawierające ciąg, na przykład: DF[DF.col.str.contains("foo")] Jednak to się nie udaje, ponieważ niektóre elementy są NaN: Błąd wartości: nie można indeksować wektorem zawierającym wartości NA / NaN Więc uciekam się do zaciemnionego DF[DF.col.notnull()][DF.col.dropna().str.contains("foo")] Czy jest lepszy sposób?

117 python pandas

4

Właściwy sposób na odwrócenie pandy.DataFrame?

Oto mój kod: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Po uruchomieniu tego kodu pojawia się następujący błąd: Traceback (most recent call last): File "C:\Python33\lib\site-packages\pandas\core\generic.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: Traceback …

117 python pandas reverse

17

Jak przekonwertować wynik zapytania SQL na strukturę danych PANDAS?

Każda pomoc w tym problemie będzie bardzo mile widziana. Zasadniczo chcę uruchomić zapytanie do mojej bazy danych SQL i zapisać zwrócone dane jako strukturę danych Pandas. Załączam kod do zapytania. Czytam dokumentację dotyczącą Pand, ale mam problem ze zidentyfikowaniem typu zwracanego zapytania. Próbowałem wydrukować wynik zapytania, ale nie zawiera on …

116 python mysql data-structures pandas

9

Wydrukuj bardzo długi ciąg w całości w ramce danych pandy

Zmagam się z pozornie bardzo prostą rzeczą, mam ramkę danych pandy zawierającą bardzo długi ciąg. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Teraz, gdy próbuję wydrukować to samo, nie widzę całego ciągu, widzę raczej tylko część ciągu. …

116 python string pandas options

Pytania otagowane jako pandas