Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

6
zidentyfikować i oznaczyć zduplikowane wiersze wr
Chciałbym zidentyfikować i oznaczyć zduplikowane wiersze na podstawie 2 kolumn. Chciałbym utworzyć unikalny identyfikator dla każdego duplikatu, więc wiem nie tylko, że wiersz jest duplikatem, ale z którym wierszem jest duplikatem. Mam ramkę danych, która wygląda jak poniżej z niektórymi zduplikowanymi parami elementów (przy dopasowaniu i usiąść) i innymi parami, …
11 r  dataframe 


6
Scal ramki danych na podstawie wielu kolumn i progów
Mam dwa data.framesz wielu wspólnych kolumnach (tu: date, city, ctry, oraz ( other_) number). Chciałbym teraz scalić je w powyższych kolumnach, ale toleruję pewien poziom różnicy: threshold.numbers <- 3 threshold.date <- 5 # in days Jeśli różnica między datewpisami wynosi > threshold.date(w dniach) lub > threshold.numbers , nie chcę, aby …
11 r  dataframe 


6
AttributeError: Obiekt „DataFrame” nie ma atrybutu „ix”
Otrzymuję powyższy błąd, gdy próbuję użyć atrybutu .ix ramki danych pandy do wyciągnięcia kolumny, np. Df.ix [:, 'col_header']. Skrypt działał od rana, ale dziś po południu uruchomiłem go w nowym środowisku linux ze świeżą instalacją Pandas. Czy ktoś jeszcze widział ten błąd? Szukałem tu i gdzie indziej, ale nie mogę …

3
Odczep tylko część kolumny z ramki danych pandy
Mam następującą przykładową ramkę danych: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) który tworzy tę ramkę danych: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | 0 | 1 | …



1
scal dwie ramki danych i dodaj poziom kolumny z nazwami
Cześć. Przekopałem się przez metody konkatacji, łączenia i łączenia pand i nie mogę znaleźć tego, czego chcę. Załóżmy, że mam dwie ramki danych A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A Col 1 Col 2 Col 3 0 A A A 1 A A …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.