Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

1
Jakich reguł używa Pandy do generowania widoku, a jakich kopii?
Jestem zdezorientowany regułami używanymi przez Pandas, gdy decyduję, że wybór z ramki danych jest kopią oryginalnej ramki danych lub widokiem oryginału. Jeśli mam na przykład df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Rozumiem, że queryzwraca kopię tak, że coś podobnego foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 nie będzie …

3
Jak sprawdzić, czy ciąg zawiera jeden z podciągów na liście w pandach?
Czy jest jakaś funkcja, która byłaby odpowiednikiem kombinacji df.isin()i df[col].str.contains()? Na przykład, powiedzmy, że mam serię s = pd.Series(['cat','hat','dog','fog','pet'])i chcę znaleźć wszystkie miejsca, w których szawiera którekolwiek z ['og', 'at'], chciałbym uzyskać wszystko oprócz „zwierzaka”. Mam rozwiązanie, ale jest raczej nieeleganckie: searchfor = ['og', 'at'] found = [s.str.contains(x) for x …



6
Konwertuj wiersz ramki danych na wektor
Chcę utworzyć wektor z wiersza ramki danych. Ale nie chcę mieć nazw wierszy i kolumn. Próbowałem kilku rzeczy ... ale nie miałem szczęścia. To jest moja ramka danych: > df <- data.frame(a=c(1,2,4,2),b=c(2,6,2,1),c=c(2.6,8.2,7.5,3)) > df a b c 1 1 2 2.6 2 2 6 8.2 3 4 2 7.5 4 …
116 r  vector  dataframe 

7
Dodanie kolumny do data.frame
Mam poniżej ramkę data.frame. Chcę dodać kolumnę, która klasyfikuje moje dane zgodnie z kolumną 1 ( h_no) w taki sposób, że pierwsza seria h_no 1,2,3,4 to klasa 1, druga seria h_no(1 do 7) to klasa 2 itd. takie jak wskazano w ostatniej kolumnie. h_no h_freq h_freqsq 1 0.09091 0.008264628 1 …
115 r  dataframe 

9
Pretty Drukowanie ramki danych pandy
Jak mogę wydrukować ramkę danych pandy jako ładną tabelę tekstową, jak poniżej? +------------+---------+-------------+ | column_one | col_two | column_3 | +------------+---------+-------------+ | 0 | 0.0001 | ABCD | | 1 | 1e-005 | ABCD | | 2 | 1e-006 | long string | | 3 | 1e-007 | ABCD | …

11
Wstaw wiersz do pandy dataframe
Mam ramkę danych: s1 = pd.Series([5, 6, 7]) s2 = pd.Series([7, 8, 9]) df = pd.DataFrame([list(s1), list(s2)], columns = ["A", "B", "C"]) A B C 0 5 6 7 1 7 8 9 [2 rows x 3 columns] i muszę dodać pierwszy wiersz [2, 3, 4], aby uzyskać: A B …

6
Tworzenie mapy cieplnej z pand DataFrame
Mam ramkę danych wygenerowaną z pakietu Pandas Pythona. Jak mogę wygenerować mapę cieplną za pomocą DataFrame z pakietu pandy. import numpy as np from pandas import * Index= ['aaa','bbb','ccc','ddd','eee'] Cols = ['A', 'B', 'C','D'] df = DataFrame(abs(np.random.randn(5, 4)), index= Index, columns=Cols) >>> df A B C D aaa 2.431645 1.248688 …

9
Zwróć wiele kolumn z pand zastosuj ()
Mam pandy DataFrame, df_test. Zawiera kolumnę „rozmiar”, która reprezentuje rozmiar w bajtach. Obliczyłem KB, MB i GB za pomocą następującego kodu: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", …

4
Konwertuj nagłówek wiersza na kolumnę dla Pandas DataFrame,
Dane, z którymi muszę pracować, są trochę niechlujne ... Zawiera nazwy nagłówków w swoich danych. Jak mogę wybrać wiersz z istniejącej ramki danych pandy i ustawić go (zmienić jego nazwę na) jako nagłówek kolumny? Chcę zrobić coś takiego: header = df[df['old_header_name1'] == 'new_header_name1'] df.columns = header

4
Konwertuj czas uniksowy na czytelną datę w ramce danych pandy
Mam ramkę danych z czasami i cenami uniksowymi. Chcę przekonwertować kolumnę indeksu, aby była wyświetlana w postaci czytelnej dla człowieka. Na przykład mam datejak 1349633705w kolumnie indeksu, ale chciałbym, aby był wyświetlany jako 10/07/2012(lub przynajmniej 10/07/2012 18:15). Dla niektórych kontekstów, oto kod, z którym pracuję i to, co już próbowałem: …


8
Porównaj dwie kolumny za pomocą pand
Używając tego jako punktu wyjścia: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Chcę użyć czegoś w rodzaju ifoświadczenia w pandach. if df['one'] >= df['two'] …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.