Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych


4
Czym jest zakłopotanie?
Natknąłem się na termin zakłopotanie, które odnosi się do uśrednionego logarytmicznie odwrotnego prawdopodobieństwa na niewidzialnych danych. Artykuł Wikipedii na temat zakłopotania nie nadaje temu samemu intuicyjnego znaczenia. Tę miarę zakłopotania wykorzystano w pracy pLSA . Czy ktoś może wyjaśnić potrzebę i intuicyjne znaczenie pomiaru zakłopotania ?

9
Korelacja nie oznacza związku przyczynowego; ale co, gdy jedną ze zmiennych jest czas?
Wiem, że pytanie zostało zadane miliard razy, więc po zapoznaniu się z Internetem jestem w pełni przekonany, że korelacja między 2 zmiennymi nie oznacza związku przyczynowego. W jednym z moich dzisiejszych wykładów statystycznych mieliśmy wykład gościnny z fizykiem na temat znaczenia metod statystycznych w fizyce. Powiedział zdumiewające oświadczenie: korelacja nie …

10
Dlaczego 600 na 1000 jest bardziej przekonujących niż 6 na 10?
Spójrz na ten fragment z „Podręcznika umiejętności uczenia się”, Palgrave, 2012, autorstwa Stelli Cottrell, strona 155: Procenty Zauważ, kiedy podane są procenty. Załóżmy, że powyższe oświadczenie brzmi: 60% osób preferowało pomarańcze; 40% stwierdziło, że wolą jabłka. Wygląda to przekonująco: podano wartości liczbowe. Ale czy różnica między 60% a 40% jest …

6
Znaczenie lokalnej normalizacji odpowiedzi w CNN
Odkryłem, że Imagenet i inne duże CNN korzystają z lokalnych warstw normalizacji odpowiedzi. Nie mogę jednak znaleźć tylu informacji na ich temat. Jak ważne są i kiedy należy je stosować? From http://caffe.berkeleyvision.org/tutorial/layers.html#data-layers : „Lokalna warstwa normalizacyjna odpowiedzi dokonuje pewnego rodzaju„ bocznego hamowania ”poprzez normalizację w lokalnych regionach wejściowych. W trybie …

10
Czy Twoje szanse na śmierć w katastrofie lotniczej są mniejsze, jeśli lecisz bezpośrednio?
Niedawno miałem spór z przyjacielem o zminimalizowaniu szansy na śmierć w samolocie z powodu wypadku. To podstawowe pytanie statystyczne. Stwierdził, że woli lecieć bezpośrednio do miejsca docelowego, ponieważ zmniejsza to prawdopodobieństwo, że zginie w katastrofie lotniczej. Jego logika polegała na tym, że jeśli prawdopodobieństwo katastrofy komercyjnej linii lotniczej wynosi 1 …

1
Sieci neuronowe: pęd zmiany masy i spadek masy ciała
Momentum służy do zmniejszenia wahań zmian masy w kolejnych iteracjach:αα\alpha gdzieE(w)jest funkcją błędu,w- wektor wag,η- szybkość uczenia się.Δ ωja( t + 1 ) = - η∂mi∂wja+ α Δ ωja( t ) ,Δωi(t+1)=−η∂E∂wi+αΔωi(t),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t),E(w)E(w)E({\bf w})ww{\bf w}ηη\eta Rozpad masy karze zmiany masy:λλ\lambda Δωi(t+1)=−η∂E∂wi−ληωiΔωi(t+1)=−η∂E∂wi−ληωi\Delta\omega_i(t+1) =- …

2
Wykorzystanie lmera do liniowego modelu mieszanego z powtarzanymi pomiarami
EDYCJA 2: Początkowo myślałem, że muszę uruchomić ANOVA dwuskładnikową z powtarzanymi pomiarami dla jednego czynnika, ale teraz myślę, że liniowy model mieszanego efektu będzie działał lepiej dla moich danych. Myślę, że prawie wiem, co musi się wydarzyć, ale wciąż jestem zdezorientowany kilkoma punktami. Eksperymenty, które muszę przeanalizować, wyglądają tak: Osobników …



2
Pandy / Statsmodel / Scikit-learn
Czy Pandy, Statsmodels i Scikit-learning uczą się różnych wdrożeń uczenia maszynowego / operacji statystycznych, czy też wzajemnie się uzupełniają? Który z nich ma najbardziej kompleksową funkcjonalność? Który jest aktywnie rozwijany i / lub wspierany? Muszę wdrożyć regresję logistyczną. Wszelkie sugestie, które z nich powinienem zastosować?

5
Dobre gry do nauki statystycznego myślenia?
Czy są jakieś gry, w których gracz „myśli jak statystyki”? Na przykład lightbot pozwala „myśleć jak programista” (w bardzo prosty sposób). Czy są jakieś gry - przeznaczone do rozrywki lub nauczania - które mogą pomóc w oswojeniu się z podstawowymi pojęciami, takimi jak korelacja, wartości p, najmniejsze kwadraty, wariancja, różne …


4
OpenBugs vs. JAGS
Za chwilę wypróbuję środowisko w stylu BUGS do szacowania modeli bayesowskich. Czy są jakieś ważne zalety, które należy wziąć pod uwagę, wybierając pomiędzy OpenBugs lub JAGS? Czy jedna może zastąpić drugą w dającej się przewidzieć przyszłości? Będę używać wybranego Gibbsa Samplera z R. Nie mam jeszcze konkretnej aplikacji, ale raczej …
41 r  software  bugs  jags  gibbs 


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.