Programowanie pandas

7

Usuwanie kolumny indeksu w pandach podczas czytania pliku CSV

Mam następujący kod, który importuje plik CSV. Istnieją 3 kolumny i chcę ustawić dwie pierwsze z nich na zmienne. Kiedy ustawię drugą kolumnę na zmienną „wydajność”, kolumna indeksu również zostanie dołączona. Jak pozbyć się kolumny indeksu? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) energy = df.index efficiency = df.Efficiency print efficiency Próbowałem …

128 python pandas

8

Użyj .corr, aby uzyskać korelację między dwiema kolumnami

Mam następującą ramkę danych pandy Top15: Tworzę kolumnę, która szacuje liczbę cytowanych dokumentów na osobę: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Chcę poznać korelację między liczbą cytowanych dokumentów na mieszkańca a podażą energii na mieszkańca. Więc używam .corr()metody …

128 python pandas correlation

13

Jak wyświetlić wszystkie nazwy kolumn w ramce danych pandy?

Mam ramkę danych, która składa się z setek kolumn i muszę zobaczyć wszystkie nazwy kolumn. Co ja zrobiłem: In[37]: data_all2.columns Wynik to: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Jak wyświetlić wszystkie kolumny …

128 python pandas dataframe show

4

datetime dtypes w pandach read_csv

Czytam w pliku csv z wieloma kolumnami z datą i godziną. Musiałbym ustawić typy danych po wczytaniu pliku, ale czasy dat wydają się być problemem. Na przykład: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Gdy run wyświetla błąd: Błąd typu: …

127 python csv datetime pandas dataframe

10

Jak uzyskać listę wszystkich zduplikowanych elementów za pomocą pand w Pythonie?

Mam listę elementów, które prawdopodobnie mają problemy z eksportem. Chciałbym uzyskać listę zduplikowanych elementów, aby móc je ręcznie porównać. Kiedy próbuję użyć metody zduplikowanej pandy , zwraca ona tylko pierwszy duplikat. Czy istnieje sposób na zdobycie wszystkich duplikatów, a nie tylko pierwszego? Mała podsekcja mojego zbioru danych wygląda następująco: ID,ENROLLMENT_DATE,TRAINER_MANAGING,TRAINER_OPERATOR,FIRST_VISIT_DATE …

127 python pandas duplicates

9

pandy Pythona usuwają zduplikowane kolumny

Jaki jest najłatwiejszy sposób usunięcia zduplikowanych kolumn z ramki danych? Czytam plik tekstowy, który ma zduplikowane kolumny za pośrednictwem: import pandas as pd df=pd.read_table(fname) Nazwy kolumn to: Time, Time Relative, N2, Time, Time Relative, H2, etc... Wszystkie kolumny Time i Time Relative zawierają te same dane. Chcę: Time, Time Relative, …

126 python pandas

4

Jak utworzyć kolumnę krotki z dwóch kolumn w Pandach

Mam Pandas DataFrame i chcę połączyć kolumny „szerokie” i „długie”, aby utworzyć krotkę. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values Crime …

126 python dataframe pandas tuples

6

Jak zachować indeks podczas łączenia pand

Chciałbym połączyć dwa DataFramesi zachować indeks z pierwszej klatki jako indeks scalonego zbioru danych. Jednak gdy wykonuję scalanie, wynikowa ramka DataFrame ma indeks całkowity. Jak mogę określić, że chcę zachować indeks z lewej ramki danych? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': 3}, 'to_merge_on': {'a': 1, 'b': …

126 python pandas

7

Jak oszacować, ile pamięci będzie potrzebować DataFrame Pandy?

Zastanawiałem się ... Jeśli czytam, powiedzmy, plik csv o wielkości 400 MB w ramce danych pandy (używając read_csv lub read_table), czy istnieje sposób, aby oszacować, ile pamięci będzie to potrzebne? Próbuję tylko lepiej poznać ramki danych i pamięć ...

125 python pandas

2

Jak stworzyć DataFrame z losowych liczb całkowitych za pomocą Pandas?

Wiem, że jeśli używam randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) daje mi to, czego szukam, ale z elementami z normalnej dystrybucji. Ale co, jeśli chcę tylko losowych liczb całkowitych? randintdziała poprzez podanie zakresu, ale nie tablicy, jak randnrobi. Jak więc to zrobić …

124 python pandas dataframe size shapes

6

Warunkowe zamień pandy

Mam DataFrame i chcę zamienić wartości w określonej kolumnie, które przekraczają wartość zerem. Myślałem, że jest to sposób na osiągnięcie tego: df[df.my_channel > 20000].my_channel = 0 Jeśli skopiuję kanał do nowej ramki danych, to proste: df2 = df.my_channel df2[df2 > 20000] = 0 Robi dokładnie to, czego chcę, ale wydaje …

123 python pandas replace conditional-statements series

3

Znajdź nazwę kolumny, która ma maksymalną wartość dla każdego wiersza

Mam DataFrame taką jak ta: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Tutaj chcę zapytać, jak uzyskać nazwę kolumny, która ma maksymalną …

123 python pandas dataframe max

8

Pandy groupby: Jak uzyskać związek strun

Mam taką ramkę danych: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Powołanie In [10]: print df.groupby("A")["B"].sum() wróci A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Teraz chciałbym zrobić „to …

122 python pandas

8

Jak dodać wiele kolumn do ramki danych pandy w jednym zadaniu?

Jestem nowy w pandach i próbuję wymyślić, jak jednocześnie dodać wiele kolumn do pand. Każda pomoc jest mile widziana. Idealnie chciałbym to zrobić w jednym kroku, a nie w wielu powtarzanych krokach ... import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, 7]} df …

122 python pandas dataframe

3

pobieranie indeksu wiersza w pandach stosuje funkcję

Próbuję uzyskać dostęp do indeksu wiersza w funkcji stosowanej w całej DataFramePandas. Mam coś takiego: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 i zdefiniuję funkcję, która ma dostęp do elementów z podanym wierszem def rowFunc(row): return row['a'] + row['b'] * …

121 python pandas dataframe

Pytania otagowane jako pandas