Tag r-faq jest tworzony w celu grupowania ograniczonej liczby pytań omawiających problemy, które regularnie pojawiają się na tagu R. To nie jest oficjalne FAQ na temat R dla SO, ale powinno służyć jako interesujące źródło informacji o typowych problemach.
Mam bardzo duże tabele (30 milionów wierszy), które chciałbym załadować, ponieważ ramki danych w R. read.table()mają wiele wygodnych funkcji, ale wygląda na to, że w implementacji jest dużo logiki, która spowolniłaby wszystko. W moim przypadku zakładam, że znam typy kolumn z wyprzedzeniem, tabela nie zawiera żadnych nagłówków kolumn ani nazw …
Próbuję zainicjować ramkę data.frame bez żadnych wierszy. Zasadniczo chcę określić typy danych dla każdej kolumny i nazwać je, ale nie chcę tworzyć żadnych wierszy. Do tej pory najlepsze, co udało mi się zrobić, to: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Który tworzy ramkę danych z pojedynczym …
Kiedy muszę filtrować ramkę data.frame, tzn. Wyodrębnić wiersze spełniające określone warunki, wolę użyć subsetfunkcji: subset(airquality, Month == 8 & Temp > 90) Zamiast [funkcji: airquality[airquality$Month == 8 & airquality$Temp > 90, ] Są dwa główne powody mojej preferencji: Uważam, że kod czyta się lepiej, od lewej do prawej. Nawet ludzie, …
Mam wektor liczb: numbers <- c(4,23,4,23,5,43,54,56,657,67,67,435, 453,435,324,34,456,56,567,65,34,435) Jak mogę zliczyć R, ile razy wartość x pojawia się w wektorze?
Znajomy wysłał mnie po tej wielkiej tutorialu na webscraping nytimes R . Naprawdę chciałbym spróbować. Jednak pierwszym krokiem jest zainstalowanie pakietu o nazwie RJSONIO ze źródła. Znam R dość dobrze, ale nie mam pojęcia, jak zainstalować pakiet ze źródła. Używam Mac OSX.
W R, mean()a median()to standardowe funkcje które robią to, czego można oczekiwać. mode()informuje o trybie pamięci wewnętrznej obiektu, a nie o wartości, która występuje najczęściej w jego argumencie. Ale czy istnieje standardowa funkcja biblioteki, która implementuje tryb statystyczny dla wektora (lub listy)?
Jak mogę połączyć (połączyć, połączyć) dwie wartości? Na przykład mam: tmp = cbind("GAD", "AB") tmp # [,1] [,2] # [1,] "GAD" "AB" Moim celem jest połączenie dwóch wartości w „tmp” w jeden ciąg: tmp_new = "GAD,AB" Która funkcja może to dla mnie zrobić?
Mam ramkę danych R z 6 kolumnami i chcę utworzyć nową ramkę danych, która ma tylko trzy kolumny. Zakładając mój ramkę danych jest dfi chcę, aby wyodrębnić kolumn A, BorazE jest to tylko dowodzić mogę dowiedzieć się: data.frame(df$A,df$B,df$E) Czy istnieje bardziej kompaktowy sposób na zrobienie tego?
Mam pewne problemy z prowadzeniem i kończeniem białych znaków w ramce data.frame. Np. Lubię przyjrzeć się konkretnemu roww data.frameoparciu o pewien warunek: > myDummy[myDummy$country == c("Austria"),c(1,2,3:7,19)] [1] codeHelper country dummyLI dummyLMI dummyUMI [6] dummyHInonOECD dummyHIOECD dummyOECD <0 rows> (or 0-length row.names) Zastanawiałem się, dlaczego nie uzyskałem oczekiwanej produkcji, skoro Austria …
Mam ramkę danych z dwiema kolumnami. Pierwsza kolumna zawiera kategorie takie jak „Pierwsza”, „Druga”, „Trzecia”, a druga kolumna zawiera liczby reprezentujące liczbę wyświetleń określonych grup z „Kategorii”. Na przykład: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 Chcę posortować dane według kategorii …
Chcę napisać trycatchkod, aby poradzić sobie z błędem podczas pobierania z sieci. url <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz") y <- mapply(readLines, con=url) Te dwie instrukcje działają poprawnie. Poniżej tworzę nieistniejący adres internetowy: url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz") url[1]nie istnieje. Jak napisać trycatchpętlę (funkcję), aby: Gdy adres URL jest nieprawidłowy, wynikiem będzie: „URL …
Wydaje mi się, że w dzisiejszych czasach udostępniam dużo kodu współautorom. Wielu z nich to początkujący / średniozaawansowani użytkownicy R i nie zdają sobie sprawy, że muszą instalować pakiety, których jeszcze nie mają. Czy istnieje elegancki sposób na połączenie installed.packages(), porównaj to z tymi, które ładuję i zainstaluj, jeśli go …
Mam problem ze znalezieniem odpowiedniej funkcji, która zwróciłaby określoną liczbę losowo pobranych wierszy bez zamiany z ramki danych w języku R? Czy ktoś może mi pomóc?
Jak zmienić to wejście (z sekwencją: czas, wejście, wyjście, pliki): Time In Out Files 1 2 3 4 2 3 4 5 Do tego wyjścia (z sekwencją: czas, wyjście, wejście, pliki)? Time Out In Files 1 3 2 4 2 4 3 5 Oto fikcyjne dane R: table <- data.frame(Time=c(1,2), …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.