Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.






7
Pandy: suma wierszy DataFrame dla danych kolumn
Mam następującą ramkę DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Chciałbym dodać kolumnę 'e', która jest sumą kolumny 'a', 'b'i …
153 python  pandas  dataframe  sum 


6
Powinienem użyć data.frame czy matrix?
Kiedy należy użyć a data.frame, a kiedy lepiej użyć matrix? Oba przechowują dane w formacie prostokątnym, więc czasami jest to niejasne. Czy są jakieś ogólne zasady określające, kiedy należy używać jakiego typu danych?
152 r  matrix  dataframe  r-faq 


3
Operatory logiczne do indeksowania wartości logicznych w Pandach
Pracuję z indeksem boolowskim w Pandach. Pytanie brzmi, dlaczego stwierdzenie: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] działa dobrze, podczas gdy a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] kończy pracę z błędem? Przykład: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one …

8
Czy pandy mogą automatycznie rozpoznawać daty?
Dziś pozytywnie zaskoczył mnie fakt, że pandy odczytując dane z pliku danych (np.) Potrafią rozpoznać typy wartości: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Przykładowo można to sprawdzić w ten sposób: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) W szczególności liczby całkowite, zmiennoprzecinkowe i łańcuchy zostały poprawnie rozpoznane. Jednak mam …
151 python  date  types  dataframe  pandas 

3
Pandy tworzą puste ramki DataFrame zawierające tylko nazwy kolumn
Mam dynamiczną ramkę DataFrame, która działa dobrze, ale gdy nie ma żadnych danych do dodania do ramki DataFrame, pojawia się błąd. Dlatego potrzebuję rozwiązania, aby utworzyć pustą ramkę DataFrame z tylko nazwami kolumn. Na razie mam coś takiego: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there are now row data inserted. …
151 python  pandas  dataframe 

10
Najszybszy sposób na zastąpienie NA w dużej tabeli danych
Mam dużą tabelę danych z wieloma brakującymi wartościami rozrzuconymi po ~ 200 tys. Wierszach i 200 kolumnach. Chciałbym ponownie zakodować te wartości NA zera tak efektywnie, jak to możliwe. Widzę dwie opcje: 1: Konwertuj na ramkę danych i użyj czegoś takiego 2: Jakieś fajne polecenie ustawienia podrzędnego danych. Tabeli Będę …


12
Zastępowanie pustych wartości (spacji) NaN w pandach
Chcę znaleźć wszystkie wartości w ramce danych Pandas, które zawierają białe znaki (dowolną ilość) i zastąpić te wartości NaN. Jakieś pomysły, jak można to poprawić? Zasadniczo chcę to zmienić: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz 2000-01-05 -0.222552 4 …
150 python  pandas  dataframe 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.