Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych


5
Czy fakt, że mój włoski syn będzie uczęszczał do szkoły podstawowej, zmieni oczekiwaną liczbę włoskich dzieci obecnych w jego klasie?
To pytanie wynika z rzeczywistej sytuacji, na którą naprawdę byłem zaskoczony odpowiedzią. Mój syn ma rozpocząć szkołę podstawową w Londynie. Ponieważ jesteśmy Włochami, byłem ciekawy, ilu włoskich dzieci uczęszcza już do szkoły. Poprosiłem o to urzędnika ds. Przyjęć podczas składania wniosku, a ona powiedziała mi, że mają średnio 2 włoskie …

2
Czy to niezwykłe, że MEAN przewyższa ARIMA?
Niedawno zastosowałem szereg metod prognozowania (MEAN, RWF, ETS, ARIMA i MLP) i stwierdziłem, że MEAN zadziwiająco dobrze. (MEAN: gdzie wszystkie przyszłe prognozy są przewidywane jako równe średniej arytmetycznej z obserwowanych wartości.) MEAN nawet przewyższył ARIMA w trzech zastosowanych przeze mnie seriach. Chcę wiedzieć, czy jest to niezwykłe? Czy to oznacza, …

2
Interwał prognozy dla modelu efektów mieszanych lmer () w R
Chcę uzyskać przedział przewidywania wokół prognozy z modelu lmer (). Znalazłem trochę dyskusji na ten temat: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq ale wydaje się, że nie uwzględniają niepewności losowych efektów. Oto konkretny przykład. Ścigam się złotą rybką. Mam dane dotyczące ostatnich 100 wyścigów. Chcę przewidzieć 101., biorąc pod uwagę niepewność moich oszacowań RE …

6
Sprawdź, czy dwa rozkłady dwumianowe różnią się statystycznie od siebie
Mam trzy grupy danych, każda z rozkładem dwumianowym (tj. Każda grupa ma elementy, które są albo sukcesem, albo porażką). Nie mam przewidywanego prawdopodobieństwa sukcesu, ale zamiast tego mogę polegać jedynie na współczynniku sukcesu każdego z nich jako przybliżeniu prawdziwego wskaźnika sukcesu. Znalazłem tylko to pytanie , które jest bliskie, ale …

1
Dlaczego glmer nie osiąga maksymalnego prawdopodobieństwa (potwierdzonego przez dalszą optymalizację ogólną)?
Wyprowadzanie liczbowe MLE z GLMM jest trudne i, w praktyce, wiem, nie powinniśmy stosować optymalizacji siły brutalnej (np. Używając optimw prosty sposób). Ale dla własnego celu edukacyjnego chcę go wypróbować, aby upewnić się, że poprawnie rozumiem model (patrz poniższy kod). Odkryłem, że zawsze otrzymuję niespójne wyniki glmer(). W szczególności, nawet …

3
Porównanie SVM i regresji logistycznej
Czy ktoś może mi podpowiedzieć, kiedy wybrać SVM lub LR? Chcę zrozumieć intuicję stojącą za różnicą między kryteriami optymalizacji uczenia się hiperpłaszczyzny tych dwóch, gdzie odpowiednie cele są następujące: SVM: Spróbuj zmaksymalizować margines między najbliższymi wektorami wsparcia LR: Maksymalizuj prawdopodobieństwo tylnej klasy Rozważmy liniową przestrzeń cech dla SVM i LR. …


2
Jak analiza czynnikowa wyjaśnia kowariancję, podczas gdy PCA wyjaśnia wariancję?
Oto cytat z książki Bishopa „Rozpoznawanie wzorców i uczenie maszynowe”, rozdział 12.2.4 „Analiza czynnikowa”: Według wyróżnionej części analizy czynnika oddaje kowariancji pomiędzy zmiennymi w macierzy WWW . Zastanawiam się JAK ? Oto jak to rozumiem. Powiedzmy, że xxx to obserwowana zmienna ppp wymiarowa, WWW to macierz obciążenia czynnikowego, a zzz …


10
Czy jest jakaś dobra książka popularnonaukowa na temat statystyki lub uczenia maszynowego?
Wokół jest mnóstwo naprawdę dobrych książek popularnonaukowych, które dotyczą prawdziwej nauki, a także historii i przyczyn obecnych teorii, a jednocześnie są niezwykle przyjemne do czytania. Na przykład „Chaos” Jamesa Gleicka (chaos, fraktale, nieliniowość), „Krótka historia czasu” Stephena Hawkinga (fizyka, pochodzenie wszechświata, czas, czarne dziury) lub „Samolubny gen” Richarda Dawkinsa ( …


4
Czy silne doświadczenie matematyczne to całkowity wymóg ML?
Zaczynam chcieć rozwijać własny zestaw umiejętności i zawsze fascynowało mnie uczenie maszynowe. Jednak sześć lat temu zamiast tego dążyć, postanowiłem podjąć całkowicie niezwiązany stopień z informatyką. Zajmuję się tworzeniem oprogramowania i aplikacji od około 8-10 lat, więc dobrze sobie z tym radzę, ale po prostu nie mogę przeniknąć matematyki do …


6
Bayesowskie a częste interpretacje prawdopodobieństwa
Czy ktoś może dobrze podsumować różnice między bayesowskim a częstym podejściem do prawdopodobieństwa? Z tego co rozumiem: Częstotliwość uważa, że ​​dane są powtarzalną próbą losową (zmienną losową) o określonej częstotliwości / prawdopodobieństwie (która jest zdefiniowana jako względna częstotliwość zdarzenia, gdy liczba prób zbliża się do nieskończoności). Podstawowe parametry i prawdopodobieństwa …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.