Programowanie dataframe

1

Jakich reguł używa Pandy do generowania widoku, a jakich kopii?

Jestem zdezorientowany regułami używanymi przez Pandas, gdy decyduję, że wybór z ramki danych jest kopią oryginalnej ramki danych lub widokiem oryginału. Jeśli mam na przykład df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Rozumiem, że queryzwraca kopię tak, że coś podobnego foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 nie będzie …

119 python pandas dataframe indexing chained-assignment

3

Jak sprawdzić, czy ciąg zawiera jeden z podciągów na liście w pandach?

Czy jest jakaś funkcja, która byłaby odpowiednikiem kombinacji df.isin()i df[col].str.contains()? Na przykład, powiedzmy, że mam serię s = pd.Series(['cat','hat','dog','fog','pet'])i chcę znaleźć wszystkie miejsca, w których szawiera którekolwiek z ['og', 'at'], chciałbym uzyskać wszystko oprócz „zwierzaka”. Mam rozwiązanie, ale jest raczej nieeleganckie: searchfor = ['og', 'at'] found = [s.str.contains(x) for x …

119 python string pandas dataframe match

5

dodaj prefiks ciągu do każdej wartości w kolumnie ciągów przy użyciu Pandas

Chciałbym dołączyć ciąg na początku każdej wartości we wspomnianej kolumnie ramki danych pandy (elegancko). Dowiedziałem się już, jak to zrobić i obecnie używam: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Wydaje się to cholernie nieeleganckie - czy znasz inny sposób (który może również dodaje znak do wierszy, w …

119 python string pandas dataframe

14

Połącz kolumny w Apache Spark DataFrame

Jak połączyć dwie kolumny w ramce danych Apache Spark? Czy w Spark SQL jest jakaś funkcja, której możemy użyć?

117 sql apache-spark dataframe apache-spark-sql

6

Konwertuj wiersz ramki danych na wektor

Chcę utworzyć wektor z wiersza ramki danych. Ale nie chcę mieć nazw wierszy i kolumn. Próbowałem kilku rzeczy ... ale nie miałem szczęścia. To jest moja ramka danych: > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 4 …

116 r vector dataframe

7

Dodanie kolumny do data.frame

Mam poniżej ramkę data.frame. Chcę dodać kolumnę, która klasyfikuje moje dane zgodnie z kolumną 1 ( h_no) w taki sposób, że pierwsza seria h_no 1,2,3,4 to klasa 1, druga seria h_no(1 do 7) to klasa 2 itd. takie jak wskazano w ostatniej kolumnie. h_no h_freq h_freqsq 1 0.09091 0.008264628 1 …

115 r dataframe

9

Pretty Drukowanie ramki danych pandy

Jak mogę wydrukować ramkę danych pandy jako ładną tabelę tekstową, jak poniżej? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD | …

114 python pandas dataframe printing

11

Wstaw wiersz do pandy dataframe

Mam ramkę danych: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] i muszę dodać pierwszy wiersz [2, 3, 4], aby uzyskać: A B …

112 python pandas dataframe insert

6

Tworzenie mapy cieplnej z pand DataFrame

Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować mapę cieplną za pomocą DataFrame z pakietu pandy. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D aaa 2.431645 1.248688 …

112 python pandas dataframe heatmap

9

Zwróć wiele kolumn z pand zastosuj ()

Mam pandy DataFrame, df_test. Zawiera kolumnę „rozmiar”, która reprezentuje rozmiar w bajtach. Obliczyłem KB, MB i GB za pomocą następującego kodu: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", …

112 python pandas dataframe apply

4

Konwertuj nagłówek wiersza na kolumnę dla Pandas DataFrame,

Dane, z którymi muszę pracować, są trochę niechlujne ... Zawiera nazwy nagłówków w swoich danych. Jak mogę wybrać wiersz z istniejącej ramki danych pandy i ustawić go (zmienić jego nazwę na) jako nagłówek kolumny? Chcę zrobić coś takiego: header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

111 python pandas rename dataframe

4

Konwertuj czas uniksowy na czytelną datę w ramce danych pandy

Mam ramkę danych z czasami i cenami uniksowymi. Chcę przekonwertować kolumnę indeksu, aby była wyświetlana w postaci czytelnej dla człowieka. Na przykład mam datejak 1349633705w kolumnie indeksu, ale chciałbym, aby był wyświetlany jako 10/07/2012(lub przynajmniej 10/07/2012 18:15). Dla niektórych kontekstów, oto kod, z którym pracuję i to, co już próbowałem: …

110 python pandas unix-timestamp dataframe

11

Dołączasz listę lub serię do pandy DataFrame jako wiersz?

Dlatego zainicjowałem puste pandy DataFrame i chciałbym iteracyjnie dołączać listy (lub serie) jako wiersze w tej ramce DataFrame. Jaki jest najlepszy sposób na zrobienie tego?

110 python pandas append dataframe

8

Porównaj dwie kolumny za pomocą pand

Używając tego jako punktu wyjścia: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Chcę użyć czegoś w rodzaju ifoświadczenia w pandach. if df['one'] >= df['two'] …

110 python pandas if-statement dataframe

5

Wybierz pierwsze 4 wiersze data.frame w R.

Jak mogę wybrać pierwsze 4 rzędy data.frame: Weight Response 1 Control 59 0.0 2 Treatment 90 0.8 3 Treatment 47 0.1 4 Treamment 106 0.1 5 Control 85 0.7 6 Treatment 73 0.6 7 Control 61 0.2

109 r dataframe

Pytania otagowane jako dataframe