Pytania otagowane jako dplyr

Użyj tego tagu w przypadku pytań dotyczących funkcji z pakietu dplyr, takich jak group_by, summarize, filter i select.

3
data.table vs dplyr: czy można zrobić coś dobrze, a drugiego nie, lub źle?
Przegląd Jestem względnie obeznany data.table, ale nie bardzo dplyr. Przeczytałem niektóre dplyrwiniety i przykłady, które pojawiły się na SO, i jak dotąd moje wnioski są następujące: data.tablei dplyrsą porównywalne pod względem prędkości, z wyjątkiem sytuacji, gdy istnieje wiele (tj.> 10–100 tys.) grup oraz w niektórych innych okolicznościach (patrz punkty odniesienia …
758 r  data.table  dplyr 

5
Wyświetl / wydrukuj wszystkie wiersze tabeli (tbl_df)
tibble(poprzednio tbl_df) jest wersją ramki danych utworzonej przez dplyrpakiet do manipulacji ramkami danych w R. Zapobiega to powstawaniu długich tabel przy przypadkowym wywołaniu ramki danych. Czy po zawinięciu ramki danych przez tibble/ tbl_df, istnieje jednak polecenie, aby wyświetlić całą ramkę danych (wszystkie wiersze i kolumny ramki danych)? Jeśli użyję df[1:100,], …
192 r  dplyr  options  display 

4
Filtruj wiersze zawierające określony ciąg
Muszę filtrować ramkę danych, używając jako kryterium tych wierszy, w których znajduje się ciąg RTB. Używam dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Wiem, że mogę korzystać z funkcji filterw dplyrale nie dokładnie, jak to powiedzieć, aby sprawdzić treść napisu. W szczególności chcę sprawdzić zawartość …
188 r  filter  dplyr 


7
Wyodrębnij kolumnę dplyr tbl jako wektor
Czy istnieje bardziej zwięzły sposób na pobranie jednej kolumny tabeli dplyr jako wektora z tabeli z zapleczem bazy danych (tj. Ramki / tabeli danych nie można bezpośrednio podzestawiać)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL To byłoby zbyt łatwe, więc collect(select(iris2, Species))[, 1] …

8
Naprawianie wielokrotnego ostrzeżenia „nieznana kolumna”
Mam ciągłe wielokrotne ostrzeżenie o „nieznanej kolumnie” dla wszystkich typów poleceń (np. Str (x) do instalowania aktualizacji na pakietach) i nie wiem, jak to debugować lub naprawić. Ostrzeżenie „nieznana kolumna” jest wyraźnie powiązane ze zmienną w tbl_df, której nazwę zmieniłem, ale ostrzeżenie pojawia się we wszystkich rodzajach poleceń pozornie niezwiązanych …
171 r  dplyr 

8
Używaj dynamicznych nazw zmiennych w „dplyr”
Chcę użyć dplyr::mutate()do utworzenia wielu nowych kolumn w ramce danych. Nazwy kolumn i ich zawartość powinny być generowane dynamicznie. Przykładowe dane z tęczówki: library(dplyr) iris <- tbl_df(iris) Utworzyłem funkcję do mutowania moich nowych kolumn ze Petal.Widthzmiennej: multipetal <- function(df, n) { varname <- paste("petal", n , sep=".") df <- mutate(df, …
168 r  dplyr  r-faq 


7
Względne częstotliwości / proporcje z dplyr
Załóżmy, że chcę obliczyć proporcje różnych wartości w każdej grupie. Na przykład, przy użyciu mtcarsdanych, jak mogę obliczyć względną częstotliwość liczby biegów przez rano (automatyczny / manualny) w jednej porcji z dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am …
153 r  group-by  dplyr  frequency 

9
Wybierz pierwszy i ostatni wiersz z pogrupowanych danych
Pytanie Używając dplyr, jak wybrać górne i dolne obserwacje / wiersze zgrupowanych danych w jednej instrukcji? Dane i przykład Biorąc pod uwagę ramkę danych df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Mogę uzyskać górne i dolne obserwacje z każdej grupy, używając slice, ale używając dwóch oddzielnych instrukcji: firstStop <- df %>% group_by(id) …
137 r  dplyr 

6
Usuń zduplikowane wiersze za pomocą dplyr
Mam taką ramkę danych - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 …
128 r  dplyr 

6
Stosowanie funkcji do każdego wiersza tabeli przy użyciu narzędzia dplyr?
Podczas pracy plyrczęsto uważałem, że przydatne jest użycie adplyfunkcji skalarnych, które muszę zastosować do każdego wiersza. na przykład data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 …
121 r  plyr  dplyr 

4
Co oznacza funkcja%>% w R?
Widziałem użycie funkcji %>%(procent większy niż procent) w niektórych pakietach, takich jak dplyr i rvest . Co to znaczy? Czy jest to sposób na pisanie bloków zamykających w R?
120 r  syntax  dplyr  magrittr  r-faq 

6
Zamiennik dla „rename” w dplyr
Podoba mi się funkcja zmiany nazwy Plyra rename. Niedawno zacząłem używać dplyr i zastanawiałem się, czy istnieje łatwy sposób zmiany nazw zmiennych za pomocą funkcji z dplyr, która jest tak łatwa w użyciu, jak w przypadku Plyr rename?
118 r  rename  dplyr 

1
Jak zinterpretować komunikat dplyr `summarize ()` przegrupowując wyjście przez 'x' (nadpisać argumentem `.groups`)?
Zacząłem otrzymywać nową wiadomość (patrz tytuł posta) podczas uruchamiania group_by i summarize () po aktualizacji do wersji rozwojowej dplyr 0.8.99.9003. Oto przykład odtworzenia wyniku: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents = rowSums(select_if(., is.numeric))) %>% …
115 r  dplyr  summarize 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.