Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

1
Zastosuj funkcję do każdej komórki w DataFrame
Mam ramkę danych, która może wyglądać następująco: A B C foo bar foo bar bar foo foo bar Chcę przejrzeć każdy element każdego wiersza (lub każdy element każdej kolumny) i zastosować następującą funkcję, aby uzyskać kolejny DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar …

3
Podziel dużą ramkę danych na listę ramek danych na podstawie wspólnej wartości w kolumnie
Mam ramkę danych z 10 kolumnami, zbierającą akcje „użytkowników”, gdzie jedna z kolumn zawiera identyfikator (nie jest unikalny, identyfikujący użytkownika) (kolumna 10). długość ramki danych wynosi około 750000 wierszy. Próbuję wyodrębnić pojedyncze ramki danych (więc otrzymuję listę lub wektor ramek danych) podzielone według kolumny zawierającej identyfikator „użytkownika”, aby wyodrębnić działania …

5
Konwertuj nazwany wektor znaków na data.frame
Mam nazwany wektor znaków zwrócony z xmlAttrs w następujący sposób: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Chciałbym przekonwertować go na ramkę danych, która wygląda następująco: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

3
Połącz dwie pandy Data Frames (połącz we wspólnej kolumnie)
Mam 2 ramki danych: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null values …

7
Wybierz pierwszy wiersz według grupy
Z takiej ramki danych test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 5 …
85 r  dataframe  sqldf 



16
Zmień nazwę wielu kolumn według nazw
Ktoś powinien był już o to zapytać, ale nie mogłem znaleźć odpowiedzi. Powiedz, że mam: x = data.frame(q=1,w=2,e=3, ...and many many columns...) jaki jest najbardziej elegancki sposób zmiany nazwy dowolnego podzbioru kolumn, których pozycji niekoniecznie znam, na inne dowolne nazwy? np. powiedz, że chcę zmienić nazwę "q"i "e"na "A"i "B"jaki …
84 r  dataframe  rename  r-faq 


6
Jak połączyć serię i ramkę DataFrame
Jeśli przyszedłeś tutaj, szukając informacji na temat łączenia znaków DataFramei Seriesw indeksie , spójrz na tę odpowiedź . Pierwotnym zamiarem PO było zapytanie, jak przypisać elementy serii jako kolumny do innej ramki DataFrame . Jeśli chcesz poznać odpowiedź na to pytanie, spójrz na odpowiedź zaakceptowaną przez EdChum. Najlepsze, co mogę …

5
Python Pandas Jak przypisać wyniki operacji grupowania z powrotem do kolumn w nadrzędnej ramce danych?
Mam następującą ramkę danych w IPythonie, gdzie każdy wiersz jest pojedynczą akcją: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210 non-null values MarketCap 21210 non-null values PriceReturn 21210 non-null values SEDOL 21210 non-null values …


10
Jak zamienić wartości NA w tabeli dla wybranych kolumn
Jest wiele postów dotyczących zastępowania wartości NA. Zdaję sobie sprawę, że w poniższej tabeli / ramce można zastąpić NA: x[is.na(x)]<-0 Ale co, jeśli chcę ograniczyć to tylko do niektórych kolumn? Pokażę ci przykład. Najpierw zacznijmy od zbioru danych. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, replace=T), c=sample(c(1:5,NA), 10, replace=T)) …

1
Konwertuj ramkę danych na plik data.table bez kopiowania
Mam dużą ramkę danych (rzędu kilku GB), którą chciałbym przekonwertować na plik data.table. Użycie as.data.tabletworzy kopię ramki danych, co oznacza, że ​​potrzebuję dostępnej pamięci co najmniej dwukrotnie większej niż dane. Czy istnieje sposób na wykonanie konwersji bez kopii? Oto prosty przykład do zademonstrowania: library(data.table) N <- 1e6 K <- 1e2 …

13
Elegancki sposób zgłaszania brakujących wartości w data.frame
Oto mały fragment kodu, który napisałem, aby zgłosić zmienne z brakującymi wartościami z ramki danych. Próbuję wymyślić bardziej elegancki sposób, aby to zrobić, taki, który być może zwraca ramkę danych, ale utknąłem: for (Var in names(airquality)) { missing <- sum(is.na(airquality[,Var])) if (missing > 0) { print(c(Var,missing)) } } Edycja: mam …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.