Pytania otagowane jako r-faq

Tag r-faq jest tworzony w celu grupowania ograniczonej liczby pytań omawiających problemy, które regularnie pojawiają się na tagu R. To nie jest oficjalne FAQ na temat R dla SO, ale powinno służyć jako interesujące źródło informacji o typowych problemach.

11
Szybki odczyt bardzo dużych tabel jako ramek danych
Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować, ponieważ ramki danych w R. read.table()mają wiele wygodnych funkcji, ale wygląda na to, że w implementacji jest dużo logiki, która spowolniłaby wszystko. W moim przypadku zakładam, że znam typy kolumn z wyprzedzeniem, tabela nie zawiera żadnych nagłówków kolumn ani nazw …
502 r  import  dataframe  r-faq 

16
Utwórz pustą ramkę danych
Próbuję zainicjować ramkę data.frame bez żadnych wierszy. Zasadniczo chcę określić typy danych dla każdej kolumny i nazwać je, ale nie chcę tworzyć żadnych wierszy. Do tej pory najlepsze, co udało mi się zrobić, to: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Który tworzy ramkę danych z pojedynczym …
480 r  dataframe  r-faq 

2
Dlaczego „[„ lepszy niż „podzbiór”?
Kiedy muszę filtrować ramkę data.frame, tzn. Wyodrębnić wiersze spełniające określone warunki, wolę użyć subsetfunkcji: subset(airquality, Month == 8 & Temp > 90) Zamiast [funkcji: airquality[airquality$Month == 8 & airquality$Temp > 90, ] Są dwa główne powody mojej preferencji: Uważam, że kod czyta się lepiej, od lewej do prawej. Nawet ludzie, …
400 r  filter  subset  r-faq 


6
Jak zainstalować pakiet R ze źródła?
Znajomy wysłał mnie po tej wielkiej tutorialu na webscraping nytimes R . Naprawdę chciałbym spróbować. Jednak pierwszym krokiem jest zainstalowanie pakietu o nazwie RJSONIO ze źródła. Znam R dość dobrze, ale nie mam pojęcia, jak zainstalować pakiet ze źródła. Używam Mac OSX.
392 r  package  install  r-faq 

30
Czy jest wbudowana funkcja wyszukiwania trybu?
W R, mean()a median()to standardowe funkcje które robią to, czego można oczekiwać. mode()informuje o trybie pamięci wewnętrznej obiektu, a nie o wartości, która występuje najczęściej w jego argumencie. Ale czy istnieje standardowa funkcja biblioteki, która implementuje tryb statystyczny dla wektora (lub listy)?
391 r  statistics  r-faq 

12
Jak można połączyć dwa łańcuchy?
Jak mogę połączyć (połączyć, połączyć) dwie wartości? Na przykład mam: tmp = cbind("GAD", "AB") tmp # [,1] [,2] # [1,] "GAD" "AB" Moim celem jest połączenie dwóch wartości w „tmp” w jeden ciąg: tmp_new = "GAD,AB" Która funkcja może to dla mnie zrobić?

10
Wyodrębnianie określonych kolumn z ramki danych
Mam ramkę danych R z 6 kolumnami i chcę utworzyć nową ramkę danych, która ma tylko trzy kolumny. Zakładając mój ramkę danych jest dfi chcę, aby wyodrębnić kolumn A, BorazE jest to tylko dowodzić mogę dowiedzieć się: data.frame(df$A,df$B,df$E) Czy istnieje bardziej kompaktowy sposób na zrobienie tego?
365 r  dataframe  r-faq 

13
Jak przyciąć wiodące i końcowe białe znaki?
Mam pewne problemy z prowadzeniem i kończeniem białych znaków w ramce data.frame. Np. Lubię przyjrzeć się konkretnemu roww data.frameoparciu o pewien warunek: > myDummy[myDummy$country == c("Austria"),c(1,2,3:7,19)] [1] codeHelper country dummyLI dummyLMI dummyUMI [6] dummyHInonOECD dummyHIOECD dummyOECD <0 rows> (or 0-length row.names) Zastanawiałem się, dlaczego nie uzyskałem oczekiwanej produkcji, skoro Austria …

15
Jak zsumować zmienną według grupy
Mam ramkę danych z dwiema kolumnami. Pierwsza kolumna zawiera kategorie takie jak „Pierwsza”, „Druga”, „Trzecia”, a druga kolumna zawiera liczby reprezentujące liczbę wyświetleń określonych grup z „Kategorii”. Na przykład: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 Chcę posortować dane według kategorii …
357 r  dataframe  aggregate  r-faq 

8
Jak dodać zera wiodące?
Mam zestaw danych, który wygląda mniej więcej tak: anim <- c(25499,25500,25501,25502,25503,25504) sex <- c(1,2,2,1,2,1) wt <- c(0.8,1.2,1.0,2.0,1.8,1.4) data <- data.frame(anim,sex,wt) data anim sex wt anim2 1 25499 1 0.8 2 2 25500 2 1.2 2 3 25501 2 1.0 2 4 25502 1 2.0 2 5 25503 2 1.8 2 …

5
Jak napisać trycatch w R.
Chcę napisać trycatchkod, aby poradzić sobie z błędem podczas pobierania z sieci. url <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz") y <- mapply(readLines, con=url) Te dwie instrukcje działają poprawnie. Poniżej tworzę nieistniejący adres internetowy: url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz") url[1]nie istnieje. Jak napisać trycatchpętlę (funkcję), aby: Gdy adres URL jest nieprawidłowy, wynikiem będzie: „URL …

28
Elegancki sposób na sprawdzenie brakujących pakietów i ich instalację?
Wydaje mi się, że w dzisiejszych czasach udostępniam dużo kodu współautorom. Wielu z nich to początkujący / średniozaawansowani użytkownicy R i nie zdają sobie sprawy, że muszą instalować pakiety, których jeszcze nie mają. Czy istnieje elegancki sposób na połączenie installed.packages(), porównaj to z tymi, które ładuję i zainstaluj, jeśli go …
336 r  packages  r-faq 


11
Jak zmienić kolejność kolumn w ramce danych?
Jak zmienić to wejście (z sekwencją: czas, wejście, wyjście, pliki): Time In Out Files 1 2 3 4 2 3 4 5 Do tego wyjścia (z sekwencją: czas, wyjście, wejście, pliki)? Time Out In Files 1 3 2 4 2 4 3 5 Oto fikcyjne dane R: table <- data.frame(Time=c(1,2), …
311 r  sorting  dataframe  r-faq 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.