Statystyki i duże zbiory danych

3

Regresja wyniku (stosunek lub ułamek) między 0 a 1

Mam na myśli zbudowanie modelu przewidującego stosunek , gdzie a ≤ b oraz a > 0 i b > 0 . Tak więc stosunek wynosiłby od 0 do 1 .a / ba/ba/ba ≤ ba≤ba \le ba > 0a>0a > 0b > 0b>0b > 0000111 Mógłbym użyć regresji liniowej, chociaż nie …

42 regression logistic generalized-linear-model beta-distribution beta-regression

4

Czym jest zakłopotanie?

Natknąłem się na termin zakłopotanie, które odnosi się do uśrednionego logarytmicznie odwrotnego prawdopodobieństwa na niewidzialnych danych. Artykuł Wikipedii na temat zakłopotania nie nadaje temu samemu intuicyjnego znaczenia. Tę miarę zakłopotania wykorzystano w pracy pLSA . Czy ktoś może wyjaśnić potrzebę i intuicyjne znaczenie pomiaru zakłopotania ?

42 measurement perplexity

9

Korelacja nie oznacza związku przyczynowego; ale co, gdy jedną ze zmiennych jest czas?

Wiem, że pytanie zostało zadane miliard razy, więc po zapoznaniu się z Internetem jestem w pełni przekonany, że korelacja między 2 zmiennymi nie oznacza związku przyczynowego. W jednym z moich dzisiejszych wykładów statystycznych mieliśmy wykład gościnny z fizykiem na temat znaczenia metod statystycznych w fizyce. Powiedział zdumiewające oświadczenie: korelacja nie …

41 correlation mathematical-statistics causality

10

Dlaczego 600 na 1000 jest bardziej przekonujących niż 6 na 10?

Spójrz na ten fragment z „Podręcznika umiejętności uczenia się”, Palgrave, 2012, autorstwa Stelli Cottrell, strona 155: Procenty Zauważ, kiedy podane są procenty. Załóżmy, że powyższe oświadczenie brzmi: 60% osób preferowało pomarańcze; 40% stwierdziło, że wolą jabłka. Wygląda to przekonująco: podano wartości liczbowe. Ale czy różnica między 60% a 40% jest …

41 statistical-significance sample-size percentage

6

Znaczenie lokalnej normalizacji odpowiedzi w CNN

Odkryłem, że Imagenet i inne duże CNN korzystają z lokalnych warstw normalizacji odpowiedzi. Nie mogę jednak znaleźć tylu informacji na ich temat. Jak ważne są i kiedy należy je stosować? From http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers : „Lokalna warstwa normalizacyjna odpowiedzi dokonuje pewnego rodzaju„ bocznego hamowania ”poprzez normalizację w lokalnych regionach wejściowych. W trybie …

41 deep-learning convolution conv-neural-network

10

Czy Twoje szanse na śmierć w katastrofie lotniczej są mniejsze, jeśli lecisz bezpośrednio?

Niedawno miałem spór z przyjacielem o zminimalizowaniu szansy na śmierć w samolocie z powodu wypadku. To podstawowe pytanie statystyczne. Stwierdził, że woli lecieć bezpośrednio do miejsca docelowego, ponieważ zmniejsza to prawdopodobieństwo, że zginie w katastrofie lotniczej. Jego logika polegała na tym, że jeśli prawdopodobieństwo katastrofy komercyjnej linii lotniczej wynosi 1 …

41 independence transportation

1

Sieci neuronowe: pęd zmiany masy i spadek masy ciała

Momentum służy do zmniejszenia wahań zmian masy w kolejnych iteracjach:αα\alpha gdzieE(w)jest funkcją błędu,w- wektor wag,η- szybkość uczenia się.Δ ωja( t + 1 ) = - η∂mi∂wja+ α Δ ωja( t ) ,Δωi(t+1)=−η∂E∂wi+αΔωi(t),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t),E(w)E(w)E({\bf w})ww{\bf w}ηη\eta Rozpad masy karze zmiany masy:λλ\lambda Δωi(t+1)=−η∂E∂wi−ληωiΔωi(t+1)=−η∂E∂wi−ληωi\Delta\omega_i(t+1) =- …

41 neural-networks optimization regularization gradient-descent

2

Wykorzystanie lmera do liniowego modelu mieszanego z powtarzanymi pomiarami

EDYCJA 2: Początkowo myślałem, że muszę uruchomić ANOVA dwuskładnikową z powtarzanymi pomiarami dla jednego czynnika, ale teraz myślę, że liniowy model mieszanego efektu będzie działał lepiej dla moich danych. Myślę, że prawie wiem, co musi się wydarzyć, ale wciąż jestem zdezorientowany kilkoma punktami. Eksperymenty, które muszę przeanalizować, wyglądają tak: Osobników …

41 r anova mixed-model repeated-measures lme4-nlme

3

Który ma cięższy ogon, lognormalny lub gamma?

(Jest to oparte na pytaniu, które właśnie do mnie dotarło za pośrednictwem poczty elektronicznej; dodałem kontekst z poprzedniej krótkiej rozmowy z tą samą osobą). W zeszłym roku powiedziano mi, że rozkład gamma jest cięższy od logarytmicznego, i od tego czasu powiedziano mi, że tak nie jest. Który jest grubszy? Jakie …

41 distributions gamma-distribution lognormal heavy-tailed

7

Jak często musisz rzucać kostką 6-stronną, aby co najmniej raz zdobyć każdą liczbę?

Właśnie grałem z moimi dziećmi, która w zasadzie sprowadza się do: kto rzuci każdą liczbą przynajmniej raz na 6-stronnej kości, wygrywa. W końcu wygrałem, a inni ukończyli 1-2 tury później. Teraz zastanawiam się: jaka jest oczekiwana długość gry? Wiem, że oczekiwanie na liczbę rzutów do momentu trafienia w określoną liczbę …

41 probability dice coupon-collector-problem

2

Pandy / Statsmodel / Scikit-learn

Czy Pandy, Statsmodels i Scikit-learning uczą się różnych wdrożeń uczenia maszynowego / operacji statystycznych, czy też wzajemnie się uzupełniają? Który z nich ma najbardziej kompleksową funkcjonalność? Który jest aktywnie rozwijany i / lub wspierany? Muszę wdrożyć regresję logistyczną. Wszelkie sugestie, które z nich powinienem zastosować?

41 machine-learning python scikit-learn statsmodels pandas

5

Dobre gry do nauki statystycznego myślenia?

Czy są jakieś gry, w których gracz „myśli jak statystyki”? Na przykład lightbot pozwala „myśleć jak programista” (w bardzo prosty sposób). Czy są jakieś gry - przeznaczone do rozrywki lub nauczania - które mogą pomóc w oswojeniu się z podstawowymi pojęciami, takimi jak korelacja, wartości p, najmniejsze kwadraty, wariancja, różne …

41 teaching games application

20

Czy są jakieś dobre filmy dotyczące matematyki lub prawdopodobieństwa?

Czy możesz zasugerować dobre filmy, które dotyczą matematyki, prawdopodobieństw itp.? Jednym z przykładów jest 21 . Byłbym także zainteresowany filmami wykorzystującymi algorytmy (np. Deszyfrowanie tekstu). Zasadniczo filmy „naukowy” ze znanymi teoriami naukowymi, ale bez science fiction i filmów dokumentalnych. Z góry dziękuję!

41 probability references

4

OpenBugs vs. JAGS

Za chwilę wypróbuję środowisko w stylu BUGS do szacowania modeli bayesowskich. Czy są jakieś ważne zalety, które należy wziąć pod uwagę, wybierając pomiędzy OpenBugs lub JAGS? Czy jedna może zastąpić drugą w dającej się przewidzieć przyszłości? Będę używać wybranego Gibbsa Samplera z R. Nie mam jeszcze konkretnej aplikacji, ale raczej …

41 r software bugs jags gibbs

1

Czy ktoś może wyjaśnić pojęcie „wymienności”?

Widzę pojęcie „wymienności” stosowane w różnych kontekstach (np. Modele bayesowskie), ale nigdy nie rozumiałem tego terminu bardzo dobrze. Co oznacza ta koncepcja? W jakich okolicznościach przywołuje się tę koncepcję i dlaczego?

41 bayesian intuition exchangeability