Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych

27
Paradoks Śpiącej Królewny
Sytuacja Niektórzy badacze chcieliby cię uśpić. W zależności od tajnego rzutu uczciwej monety obudzą cię na krótko raz (Heads) lub dwukrotnie (Tails). Po każdym przebudzeniu uśpią cię z lekiem, który sprawi, że zapomnisz o przebudzeniu. Kiedy budzi się, do jakiego stopnia należy Ci uwierzyć, że wynik rzutu monetą był Heads? …

4
Kappa Cohena w prostym angielskim
Czytam książkę do eksploracji danych, w której wspomniano o statystyce Kappa jako sposobie oceny wydajności prognozowania klasyfikatorów. Jednak po prostu nie mogę tego zrozumieć. Sprawdziłem także Wikipedię, ale to też nie pomogło: https://en.wikipedia.org/wiki/Cohen's_kappa . W jaki sposób kappa Cohena pomaga w ocenie wydajności prognozowania klasyfikatorów? Co to mówi? Rozumiem, że …

8
Dlaczego metoda Newtona nie jest szeroko stosowana w uczeniu maszynowym?
To mnie denerwuje od jakiegoś czasu i nie mogłem znaleźć satysfakcjonujących odpowiedzi online, więc oto: Po przejrzeniu zestawu wykładów na temat optymalizacji wypukłej metoda Newtona wydaje się znacznie lepszym algorytmem niż zejście gradientu do znajdowania globalnie optymalnych rozwiązań, ponieważ metoda Newtona może zapewnić gwarancję rozwiązania, jest niezmienna afiniczna, a przede …



9
Od dołu do góry wyjaśnienie odległości Mahalanobisa?
Studiuję rozpoznawanie wzorców i statystyki i prawie każdą książkę, którą otwieram na ten temat, wpadam na pojęcie odległości Mahalanobisa . Książki zawierają intuicyjne wyjaśnienia, ale wciąż nie są wystarczająco dobre, aby naprawdę zrozumieć, co się dzieje. Gdyby ktoś zapytał mnie: „Jaka jest odległość Mahalanobisa?” Mogłem tylko odpowiedzieć: „To miła rzecz, …

9
Pozyskiwanie wiedzy z przypadkowego lasu
Losowe lasy są uważane za czarne skrzynki, ale ostatnio zastanawiałem się, jaką wiedzę można uzyskać z losowego lasu? Najbardziej oczywistą rzeczą jest znaczenie zmiennych, w najprostszym wariancie można to zrobić po prostu przez obliczenie liczby wystąpień zmiennej. Drugą rzeczą, o której myślałem, były interakcje. Myślę, że jeśli liczba drzew jest …



6
Korelacje z nieuporządkowanymi zmiennymi kategorialnymi
Mam ramkę danych z wieloma obserwacjami i wieloma zmiennymi. Niektóre z nich są kategoryczne (nieuporządkowane), a inne są numeryczne. Szukam skojarzeń między tymi zmiennymi. Byłem w stanie obliczyć korelację dla zmiennych numerycznych (korelacja Spearmana), ale: Nie wiem, jak zmierzyć korelację między nieuporządkowanymi zmiennymi kategorialnymi. Nie wiem, jak zmierzyć korelację między …



3
Dlaczego potrzebujemy sigma-algebr do definiowania przestrzeni prawdopodobieństwa?
Mamy losowy eksperyment z różnymi wynikami tworzących próbkę kosmicznego Ω,Ω,\Omega, na które patrzymy z zainteresowaniem w niektórych wzorów, zwany wydarzenia F.F.\mathscr{F}. Algebry Sigma (lub pola sigma) składają się ze zdarzeń, do których można przypisać miarę prawdopodobieństwa PP\mathbb{P}Pewne właściwości są spełnione, w tym włączenie zbioru zerowego ∅∅\varnothing i całej przestrzeni próbki …

21
Na każdym etapie ograniczającego nieskończonego procesu umieść 10 kulek w urnie i wyjmij jedną losowo. Ile pozostało piłek?
Pytanie (nieco zmodyfikowane) brzmi następująco i jeśli nigdy go nie spotkałeś, możesz to sprawdzić w przykładzie 6a, rozdział 2, Pierwszego kursu prawdopodobieństwa Sheldona Rossa : Załóżmy, że mamy nieskończenie dużą urnę i nieskończoną kolekcję piłek oznaczonych piłką numer 1, numer 2, numer 3 i tak dalej. Rozważ eksperyment przeprowadzony w …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.