tło
Jest wiele dyskusji na ten temat, więc pomyślałem, że mogę znaleźć odpowiedź z wcześniejszych kroków na StackExchange i wściekle googlować. Po pół dnia próbowania znalezienia tylko jednego podręcznika dla (bio) statystyk z R., byłem całkowicie zdezorientowany i musiałem się poddać. Może łączony darmowy materiał jest w rzeczywistości lepszy niż którakolwiek z książek, które można obecnie kupić. Dowiedzmy się.
Internet jest pełen dobrej darmowej literatury na temat języka R , więc naprawdę nie ma sensu płacić za mierną książkę, która ostatecznie jest wykorzystywana jako dekoracja biura. Strona główna R zawiera listę książek związanych z R. Jest ich wiele. Mówiąc ściślej: 115. Tylko jeden z nich jest reklamowany słowami „ samodzielny podręcznik statystyk ”. Ma teraz 8 lat i może być nieaktualny. Czwarta edycja Modern Applied Statistics z S jest jeszcze starsza. R Book jest często przegryzany jako zbyt podstawowy i nie jest zalecany z powodu braku odniesień, źle sformatowanego kodu i niechlujnego wykończenia.
Jednak szukam jednej książki , która mogłaby być samodzielnym odniesieniem do praktycznych statystyk (przede wszystkim) z R (wtórnym). Książka powinna mieszkać na biurku, gromadząc adnotacje, plamy kawy i tłuste odciski palców zamiast kurzu na półce z książkami. Powinien zastąpić zbiór darmowych plików PDF, z których korzystałem do tej pory, nie zapominając, że R ma doskonałą bibliotekę referencyjną. „ Jakie jest właściwe podejście? ”,„ Dlaczego? „i„ technicznie, jak to działa? ”to często bardziej palące pytania niż„ jak to zrobić z R? ”
Ponieważ jestem ekologiem, najbardziej interesują mnie zastosowania w biostatystyce. Ponieważ jednak te rzeczy są często powiązane, interdyscyplinarne odniesienie ogólne byłoby dla mnie najbardziej cenne.
Zadanie
Jeśli taka książka istnieje (wątpię w to), proszę podać nazwę książki (tylko jedna na odpowiedź) i krótką recenzję książki wyjaśniającą, dlaczego należy ją nazwać książką referencyjną dla tematu. Ponieważ to pytanie nie różni się zbytnio od istniejących, użyj tego bieżnika, aby uzyskać odpowiedź. Możesz także wymienić wady książki, abyśmy mogli wymienić je jako cechy idealnego podręcznika.
Moje pytanie brzmi: co powinien zawierać podręcznik do statystyk (najczęściej używanych rodzajów) z R?
Niektóre wstępne przemyślenia są następujące ogólne funkcje (proszę zaktualizować):
- Gruby jak cegła
- Zwięzłe, ale zrozumiałe
- Wypełnione cyframi (z podanym kodem R)
- Łatwe do zrozumienia tabele i diagramy opisujące najważniejsze szczegóły z tekstu
- Łatwy do zrozumienia, opisowy tekst o statystykach / metodach zawierający najważniejsze równania.
- Dobre przykłady dla każdego podejścia (z kodem R)
- Szeroka i aktualna lista referencji
- Minimalna liczba literówek
Spis treści
Ponieważ nie jestem statystykiem i potrzebowałbym tej (nieistniejącej?) Książki, aby odpowiedzieć na pytanie, trudno mi pisać o treści. Ponieważ Księga R wyraźnie zamierza być książką odniesienia dla statystyk z R, ale często jest krytykowana, skopiowałem spis treści z książki jako punkt wyjścia do spisu treści dla samodzielnego podręcznika statystyki R. Zadanie dodatkowe: proszę podać uzupełnienia, sugestie, usunięcia itp. Dla spisu treści.
- Pierwsze kroki
- Podstawy języka R.
- Wprowadzanie danych
- Ramki danych
- Grafika
- Stoły
- Matematyka
- Testy klasyczne
- Modelowanie statystyczne
- Regresja
- Analiza wariancji
- Analiza kowariancji
- Uogólnione modele liniowe
- Policz dane
- Policz dane w tabelach
- Dane dotyczące proporcji
- Zmienne odpowiedzi binarnej
- Uogólnione modele addytywne
- Modele z mieszanymi efektami
- Regresja nieliniowa
- Modele drzew
- Analiza szeregów czasowych
- Statystyka wielowymiarowa
- Statystyka przestrzenna
- Analiza przeżycia
- Modele symulacyjne
- Zmiana wyglądu grafiki
- Referencje i dalsze czytanie
- Indeks
Co zostało powiedziane wcześniej?
StackExhange zawiera kilka stopni zadających statystyki i sugestie dotyczące książek R. Książki do nauki języka R pytają o książkę informacyjną uczącą się języka R bez aspektu statystycznego. Programowanie Art of R zostało uznane za najlepszą pojedynczą sugestię. Book to Learn Statistics za pomocą R prosi o idealną książkę wprowadzającą do statystyki, która tak naprawdę nie jest tym samym, co podręcznik. Podręczniki statystyczne Open Source klasyfikują statystyki wielowymiarowe, a R jest najlepszą alternatywą. Jaką książkę poleciłbyś naukowcom niepaństwowym? pyta o najlepszą książkę ze statystykami bez określania wybranego programu.Odnośnik lub książka na temat symulacji eksperymentalnych danych projektowych w punktach R, być może najbliższych mojemu pytaniu. Wprowadzenie do programowania naukowego i symulacji Korzystanie z języka R jest najbardziej zalecaną książką tutaj i może być zbliżone do tego, czego szukam. Jednak ta książka albo nie wystarczy jako pojedyncza książka odniesienia do statystyk z R.
Kilka sugestii do podręcznika i ich wady
R in Action otrzymał lepsze recenzje niż R Book, ale wydaje się, że jest raczej wprowadzający .
Projekt i analiza biostatystyczna z wykorzystaniem R: praktyczny przewodnik może być blisko tego, czego szukam. Otrzymał dobrą recenzję , ale najwyraźniej także ta zawiera wiele literówek. Ponadto książka ta nie koncentruje się na wyjaśnianiu statystyki, ale raczej zawiera analizy statystyczne jako gotowe przepisy do wykorzystania przez naukowców.
Modele ekologiczne i dane w R pomijają poziom wprowadzający. Jest to bardzo przydatna funkcja, ponieważ słowo „wprowadzenie” powoduje 43 przypadki na liście książek R , ale być może nie jest w pełni satysfakcjonujące, jeśli szukamy informacji o statystykach…?
Wprowadzenie do programowania naukowego i symulacji Korzystanie z R zostało bardzo pozytywnie ocenione , ale ogranicza się do symulacji danych.
Richiemorrisroe to sugeruje Modern Applied Statistics with S jest wystarczająca do samodzielnego podręcznika statystyk z R. Ta książka otrzymała doskonałe recenzje ( 1 , 2 ) i jest obecnie prawdopodobnie najlepszym kandydatem do tytułu? Najnowsza wersja pojawiła się 10 lat temu, co jest dość długim okresem, jeśli chodzi o rozwój programu.
Dimitriy V. Masterov sugeruje analizę danych przy użyciu regresji i modeli wielopoziomowych / hierarchicznych . Nie sprawdziłem jeszcze tej książki.
Po przeczytaniu wielu recenzji książek wydaje się oczywiste, że idealna książka, o którą tu zapytano, jeszcze nie istnieje. Być może jednak można wybrać taki, który jest dość blisko. Ten bieżnik ma służyć jako wiki społeczności dla użytkowników statystyk, aby znaleźć najlepszą istniejącą książkę referencyjną, a także jako motywacja dla nowych i starych autorów książek do ulepszenia swojej pracy.