Pytania otagowane jako pandas

Pandas to biblioteka Pythona do manipulacji i analizy danych, np. Ramki danych, wielowymiarowe szeregi czasowe i zestawy danych przekrojowych powszechnie spotykane w statystykach, eksperymentalnych wynikach nauki, ekonometrii lub finansach. Pandas jest jedną z głównych bibliotek nauki danych w Pythonie.

7
Usuwanie kolumny indeksu w pandach podczas czytania pliku CSV
Mam następujący kod, który importuje plik CSV. Istnieją 3 kolumny i chcę ustawić dwie pierwsze z nich na zmienne. Kiedy ustawię drugą kolumnę na zmienną „wydajność”, kolumna indeksu również zostanie dołączona. Jak pozbyć się kolumny indeksu? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) energy = df.index efficiency = df.Efficiency print efficiency Próbowałem …
128 python  pandas 

8
Użyj .corr, aby uzyskać korelację między dwiema kolumnami
Mam następującą ramkę danych pandy Top15: Tworzę kolumnę, która szacuje liczbę cytowanych dokumentów na osobę: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Chcę poznać korelację między liczbą cytowanych dokumentów na mieszkańca a podażą energii na mieszkańca. Więc używam .corr()metody …

13
Jak wyświetlić wszystkie nazwy kolumn w ramce danych pandy?
Mam ramkę danych, która składa się z setek kolumn i muszę zobaczyć wszystkie nazwy kolumn. Co ja zrobiłem: In[37]: data_all2.columns Wynik to: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Jak wyświetlić wszystkie kolumny …
128 python  pandas  dataframe  show 

4
datetime dtypes w pandach read_csv
Czytam w pliku csv z wieloma kolumnami z datą i godziną. Musiałbym ustawić typy danych po wczytaniu pliku, ale czasy dat wydają się być problemem. Na przykład: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Gdy run wyświetla błąd: Błąd typu: …

10
Jak uzyskać listę wszystkich zduplikowanych elementów za pomocą pand w Pythonie?
Mam listę elementów, które prawdopodobnie mają problemy z eksportem. Chciałbym uzyskać listę zduplikowanych elementów, aby móc je ręcznie porównać. Kiedy próbuję użyć metody zduplikowanej pandy , zwraca ona tylko pierwszy duplikat. Czy istnieje sposób na zdobycie wszystkich duplikatów, a nie tylko pierwszego? Mała podsekcja mojego zbioru danych wygląda następująco: ID,ENROLLMENT_DATE,TRAINER_MANAGING,TRAINER_OPERATOR,FIRST_VISIT_DATE …

9
pandy Pythona usuwają zduplikowane kolumny
Jaki jest najłatwiejszy sposób usunięcia zduplikowanych kolumn z ramki danych? Czytam plik tekstowy, który ma zduplikowane kolumny za pośrednictwem: import pandas as pd df=pd.read_table(fname) Nazwy kolumn to: Time, Time Relative, N2, Time, Time Relative, H2, etc... Wszystkie kolumny Time i Time Relative zawierają te same dane. Chcę: Time, Time Relative, …
126 python  pandas 

4
Jak utworzyć kolumnę krotki z dwóch kolumn w Pandach
Mam Pandas DataFrame i chcę połączyć kolumny „szerokie” i „długie”, aby utworzyć krotkę. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values Crime …

6
Jak zachować indeks podczas łączenia pand
Chciałbym połączyć dwa DataFramesi zachować indeks z pierwszej klatki jako indeks scalonego zbioru danych. Jednak gdy wykonuję scalanie, wynikowa ramka DataFrame ma indeks całkowity. Jak mogę określić, że chcę zachować indeks z lewej ramki danych? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': 3}, 'to_merge_on': {'a': 1, 'b': …
126 python  pandas 



6
Warunkowe zamień pandy
Mam DataFrame i chcę zamienić wartości w określonej kolumnie, które przekraczają wartość zerem. Myślałem, że jest to sposób na osiągnięcie tego: df[df.my_channel > 20000].my_channel = 0 Jeśli skopiuję kanał do nowej ramki danych, to proste: df2 = df.my_channel df2[df2 > 20000] = 0 Robi dokładnie to, czego chcę, ale wydaje …


8
Pandy groupby: Jak uzyskać związek strun
Mam taką ramkę danych: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Powołanie In [10]: print df.groupby("A")["B"].sum() wróci A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Teraz chciałbym zrobić „to …
122 python  pandas 


3
pobieranie indeksu wiersza w pandach stosuje funkcję
Próbuję uzyskać dostęp do indeksu wiersza w funkcji stosowanej w całej DataFramePandas. Mam coś takiego: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 i zdefiniuję funkcję, która ma dostęp do elementów z podanym wierszem def rowFunc(row): return row['a'] + row['b'] * …
121 python  pandas  dataframe 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.