Statystyki i duże zbiory danych

Pytania i odpowiedzi dla osób zainteresowanych statystyką, uczeniem maszynowym, analizą danych, eksploracją danych i wizualizacją danych




2
Jak działa warstwa „Osadzanie” Keras?
Musisz zrozumieć działanie warstwy „Osadzanie” w bibliotece Keras. Wykonuję następujący kod w Pythonie import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) co daje następujący wynik input_array = [[4 1 3 …

6
Jakie są dobre masy początkowe w sieci neuronowej?
Właśnie usłyszałem, że dobrym pomysłem jest wybór początkowych wag sieci neuronowej z zakresu , gdzie jest liczba wejść do danego neuronu. Zakłada się, że zbiory są znormalizowane - średnia 0, wariancja 1 (nie wiem, czy to ma znaczenie).d( - 1re√, 1re√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt d})redd Dlaczego to dobry pomysł?



4
Jak „zsumować” odchylenie standardowe?
Mam miesięczną średnią dla wartości i standardowe odchylenie odpowiadające tej średniej. Teraz obliczam średnią roczną jako sumę średnich miesięcznych. Jak mogę przedstawić odchylenie standardowe dla sumowanej średniej? Na przykład biorąc pod uwagę produkcję z farmy wiatrowej: Month MWh StdDev January 927 333 February 1234 250 March 1032 301 April 876 …

10
Co jest złego w ekstrapolacji?
Pamiętam, jak siedziałem na kursach statystycznych jako studium słuchaczy o tym, dlaczego ekstrapolacja była złym pomysłem. Ponadto istnieje wiele źródeł online, które komentują to. Jest też wzmianka o niej tutaj . Czy ktoś może mi pomóc zrozumieć, dlaczego ekstrapolacja jest złym pomysłem? Jeśli tak, to dlaczego techniki prognozowania nie są …



11
Dlaczego powinienem być Bayesianinem, gdy mój model jest zły?
Edycje: Dodałem prosty przykład: wnioskowanie o średniej XiXjaX_i . Wyjaśniłem też nieco, dlaczego wiarygodne przedziały niepasujące do przedziałów ufności są złe. Ja, dość pobożny Bayesjan, jestem w trakcie pewnego rodzaju kryzysu wiary. Mój problem jest następujący. Załóżmy, że chcę przeanalizować niektóre dane IID XiXjaX_i . Chciałbym: najpierw zaproponuj model warunkowy: …

1
W jaki sposób prosty model regresji logistycznej osiąga 92% dokładność klasyfikacji na MNIST?
Mimo że wszystkie obrazy w zestawie danych MNIST są wyśrodkowane, z podobną skalą i odkryte bez rotacji, mają znaczącą odmianę pisma ręcznego, która zastanawia mnie, w jaki sposób model liniowy osiąga tak wysoką dokładność klasyfikacji. O ile jestem w stanie sobie wyobrazić, biorąc pod uwagę znaczną różnorodność pisma ręcznego, cyfry …

1
40 000 artykułów neurobiologicznych może się mylić
Widziałem ten artykuł w „The Economist” na temat pozornie niszczącej pracy [1], podważającej „coś w rodzaju 40 000 opublikowanych badań [fMRI]”. Mówią, że błąd wynika z „błędnych założeń statystycznych”. Czytam artykuł i widzę, że jest to częściowo problem z wielokrotnymi korektami porównania, ale nie jestem ekspertem od fMRI i trudno …

3
Czy to jest rozwiązanie problemu wartości p?
W lutym 2016 r. Amerykańskie stowarzyszenie statystyczne opublikowało formalne oświadczenie w sprawie istotności statystycznej i wartości p. Nasz wątek na ten temat obszernie omawia te problemy. Jednak do tej pory nie pojawił się żaden organ oferujący powszechnie uznaną skuteczną alternatywę. Amerykańskie Towarzystwo Statystyczne (ASS) opublikowało swoją odpowiedź, wartości p: Co …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.