Książka dla szerokiego i koncepcyjnego przeglądu metod statystycznych


12

Jestem bardzo zainteresowany potencjałem analizy statystycznej do symulacji / prognozowania / szacowania funkcji itp.

Jednak niewiele wiem na ten temat, a moja wiedza matematyczna jest wciąż dość ograniczona - jestem młodym studentem inżynierii oprogramowania.

Szukam książki, w której zacznę od pewnych rzeczy, o których wciąż czytam: regresji liniowej i innych rodzajów regresji, metod bayesowskich, metod monte carlo, uczenia maszynowego itp. Chciałbym też zacząć od R, więc jeśli istniała książka, która połączyła oba te elementy, byłoby świetnie.

Wolałbym, żeby książka wyjaśniała wszystko pojęciowo i nie zawierała zbyt wielu szczegółów technicznych - chciałabym, aby statystyki były dla mnie bardzo intuicyjne, ponieważ rozumiem, że w statystykach istnieje wiele ryzykownych pułapek.

Jestem oczywiście gotów przeczytać więcej książek, aby lepiej zrozumieć tematy, które uważam za wartościowe.

Odpowiedzi:


11
  • Może chciałbyś coś w rodzaju analizy danych i grafiki przy użyciu R: podejście oparte na przykładach autorstwa Johna Maindonalda i W. Johna Brauna

    • Strona internetowa dla książki
    • Amazon z różnorodnymi recenzjami
    • Polecam, ponieważ książka zaznacza kilka twoich pól; uczy trochę R; zapewnia przegląd szeregu różnych technik modelowania (np. regresja wielokrotna, szeregi czasowe, grafika, uogólniony model liniowy itp.) bez wchodzenia w zbyt wiele szczegółów matematycznych; jest dość stosowane.
  • Zgadzam się z @Greg Snow, że lepiej jest pomyśleć o przeczytaniu wielu różnych książek. Dla każdego wspomnianego tematu (np. Statystyki bayesowskie, szeregi czasowe, symulacje, R, uczenie maszynowe) znajdują się dobre książki poświęcone temu konkretnemu tematowi. Możesz zadać osobne pytania dotyczące tego, co byłoby dobrą książką, biorąc pod uwagę twoje szczególne zainteresowania tym tematem.

  • Dobre, swobodnie dostępne opcje online

    • Elementy uczenia statystycznego to doskonała książka, dostępna nawet online za darmo. Z twojego postu mam wrażenie, że na początku może być nieco bardziej techniczny, niż chcesz, ale sprawdź to i zobacz, co myślisz. Może teraz będziesz na to gotowy; może później.
    • Modele ekologiczne i dane Benjamina Bolkera w R to kolejny dobry model . Jest z perspektywy ekologii, ale wyjaśnia symulację i dopasowanie modelu wyraźnie z względnie nietechnicznej perspektywy; i wszystko jest zaimplementowane w R. Możesz zobaczyć cały jego kod R na stronie internetowej. Możesz nawet zobaczyć dokumenty Sweave użyte do wygenerowania książki!
    • Istnieje dobra lista darmowej dokumentacji R na temat CRAN, a niektóre dokumenty zawierają również szersze instrukcje dotyczące statystyki.

5

Jedna książka zawierająca wszystkie te tematy byłaby imponująca i prawdopodobnie ważyłaby więcej niż ty. To tak, jakby poprosić o jedną książkę, która uczy podstawowego programowania, C, Java, Perla i zaawansowanego projektowania baz danych w jednej książce (właściwie prawdopodobnie więcej, ale nie znam wystarczającej liczby terminów tworzenia oprogramowania, aby dodać kilka bardziej zaawansowanych) .

Sama regresja jest zwykle co najmniej pełnym kursem uniwersyteckim, statystyki bayesowskie wymagają kursu lub 2 teorii przed podjęciem kursu bayesowskiego w celu pełnego zrozumienia itp.

Nie ma szybkiej i łatwej drogi do tego, co próbujesz zrobić. Sugerowałbym podjęcie dobrych kursów na uniwersytecie i stamtąd pracę.

Były też dyskusje na temat dobrych książek, w których można znaleźć pomysły.


Dziękuję za Twoją odpowiedź. Jednak nie staram się zrozumieć wszystkiego na temat wszystkiego z jednej książki, ale czytając powiedzmy, 50 stron na temat regresji zdecydowanie by mi bardzo pomogło w uzyskaniu przynajmniej rozsądnego zrozumienia tego tematu ...
Jérôme Le Chatelier

5

Aby połączyć R z wieloma opisanymi metodami, oprócz tekstu Maindonald i Braun wspomnianego przez @Jeromy Anglim, proponuję rzucić okiem na te dwie książki Juliana Faraway:

Obie mają dość proste wprowadzenie do różnych tematów, ta ostatnia obejmuje szeroki zakres bardziej nowoczesnych podejść do regresji, w tym wiele technik uczenia maszynowego, ale robi to w szybszym tempie z mniejszym opisem, i oba ilustrują techniki za pomocą kodu R.

Możesz pobrać kod z sekcji Książki na stronie R, aby uzyskać 20% rabatu na RRP, jeśli kupujesz bezpośrednio w Chapman & Hall / CRC Press, ale sprawdzaj cenę Amazon lub podobną dla swojego regionu, ponieważ często obniżka na Amazon jest konkurencyjna z ceną wydawcy po rabacie.

Jedną z dobrych rzeczy w tej parze książek jest to, że dają one dobry smak nowoczesnych metod z wystarczającą ilością szczegółów, aby następnie zbadać obszary, które chcesz bardziej szczegółowo z bardziej specjalistycznymi tekstami.

Niektóre treści, które trafiły do ​​tych książek, są dostępne w internetowym pliku PDF autorstwa Juliana, za pośrednictwem sekcji Dokumenty na stronie R. Zachęcam do przejrzenia tej sekcji, aby sprawdzić, czy istnieją inne dokumenty, które mogą pomóc Ci zacząć bez konieczności wydawania gotówki. W tej sekcji można również znaleźć wczesną wersję tekstu, który stał się pierwszym wydaniem tekstu Maindonalda i Brauna.


3

Cóż, jeśli chcesz przegląd większości metod statystycznych oraz kod R dla nich, nie można zajść daleko nie tak z Venables i Ripley nowoczesnych Applied Statistics in s .

Jest prosty, przejrzysty i ma wystarczającą ilość kodu R, aby zacząć od praktycznie każdego statystycznego tematu, który chcesz nazwać.

Kupiłem tę książkę i uważałem na cenę w stosunku do liczby stron, ale warto było zainwestować. Zakładają rachunek różniczkowy i algebrę liniową, ale biorąc pod uwagę, że jesteś inżynierem, nie powinno to stanowić większego problemu.

Ich programowanie S jest również wspaniałe, ale prawdopodobnie nie to, czego teraz szukasz.


2

Elementy uczenia statystycznego mogą być nieco zastraszające dla początkujących. Poleciłbym przeczytać „ Wprowadzenie do statystycznego uczenia się za pomocą aplikacji w języku R ”, które można pobrać bezpłatnie stąd -> http://www-bcf.usc.edu/~gareth/ISL/ Opracowano również przykłady w języku R na końcu każdego rozdziału.

Uczenie maszynowe: perspektywa algorytmiczna ” Stephena Marslanda obejmuje również szerszy zakres tematów, nie zagłębiając się w matematykę.


1

Poprzednie odpowiedzi mają wiele po stronie aplikacji. Jeśli chodzi o materiał konceptualny i dobre myślenie statystyczne, poleciłbym Teorię prawdopodobieństwa: logikę nauki Edwina Jaynesa. Pierwsze trzy rozdziały są dostępne za darmo tutaj

Nie ma to jednak wielkiego wpływu na programy komputerowe, więc strona aplikacji dotyczy bardziej stylizowanych problemów. Ma genialny rozdział na temat paradoksów teorii prawdopodobieństwa, z jednym wyjątkiem, „paradoksem marginalizacji”, który jest tutaj właściwie rozwiązany (chociaż Jaynes zasadniczo „wyciąga lekcję”, ponieważ niewłaściwy uprzedni powinien być granicą sekwencji właściwych priorytetów) .


2
Sam uwielbiałem tę książkę, ale nie jestem pewien, czy jest to miejsce, w którym można zacząć budować intuicję dla statystyk. Jest to raczej polemiczny i idiosynkratyczny tekst.
Ben Lauderdale,

1

Dotychczasowe sugestie są doskonałe, ale koncentrują się na najbardziej zaawansowanych i wyrafinowanych technikach wykorzystujących oprogramowanie R. Aby uzyskać doskonały i intuicyjny przegląd klasycznych technik wielowymiarowych, podstawowe ramy dla najbardziej aktualnych podejść, w tym regresji, ANOVA, analizy czynnikowej, analizy skupień, analizy dyskryminacyjnej, analizy tabeli awaryjnej i analizy równań strukturalnych, wielowymiarowej Dillona i Goldsteina Statystyki opublikowane przez Wiley w latach 80. pozostają klasykiem. Jest przejrzysty i zastosowany w swoich przykładach, nie będąc zbyt teoretycznym ani przywiązanym do oprogramowania.

Dillon i Goldstein to książka, którą poleciłbym każdemu, kto chce zrozumieć, skąd się wzięły nowoczesne metody uczenia maszynowego.



0

Książka kucharska R to świetny sposób, aby wskoczyć do R i nauczyć się z niej korzystać. Jest bardzo praktyczny, więc świetnie nadaje się do nauki posługiwania się językiem, ale powinieneś również poszukać dobrej książki teoretycznej.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.