Statystyki i duże zbiory danych

5

W jakich przypadkach należy preferować jedno nad drugim? Znalazłem kogoś, kto twierdzi z korzyścią dla Kendall, z powodów pedagogicznych , czy są jeszcze inne powody?

69 correlation nonparametric spearman-rho kendall-tau

19

Jakie są cenne projekty open source do analizy statystycznej?

Jakie są obecnie dostępne niektóre cenne projekty open source do analizy statystycznej? Edycja: jak wskazał Sharpie, wartościowe mogą oznaczać pomoc w wykonywaniu zadań szybciej lub taniej.

69 software open-source

8

Co oznacza „zmienna losowa”?

Co mają na myśli, gdy mówią „zmienna losowa”?

69 mathematical-statistics random-variable intuition definition

2

Jak działa warstwa „Osadzanie” Keras?

Musisz zrozumieć działanie warstwy „Osadzanie” w bibliotece Keras. Wykonuję następujący kod w Pythonie import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) co daje następujący wynik input_array = [[4 1 3 …

69 text-mining word-embeddings keras

6

Jakie są dobre masy początkowe w sieci neuronowej?

Właśnie usłyszałem, że dobrym pomysłem jest wybór początkowych wag sieci neuronowej z zakresu , gdzie jest liczba wejść do danego neuronu. Zakłada się, że zbiory są znormalizowane - średnia 0, wariancja 1 (nie wiem, czy to ma znaczenie).d( - 1re√, 1re√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt d})redd Dlaczego to dobry pomysł?

68 neural-networks normalization

4

Jak dostroić hiperparametry drzew xgboost?

Mam dane niezrównoważone w klasie i chcę dostroić hiperparametry wzmocnionego warkocza za pomocą xgboost. pytania Czy istnieje odpowiednik gridsearchcv lub randomsearchcv dla xgboost? Jeśli nie, jakie jest zalecane podejście do dostrojenia parametrów xgboost?

68 machine-learning cross-validation xgboost boosting

7

Czy wszystkie warunki interakcji wymagają indywidualnych warunków w modelu regresji?

Właśnie recenzuję manuskrypt, w którym autorzy porównują modele regresji logit 5-6 z AIC. Jednak niektóre modele mają warunki interakcji bez uwzględnienia poszczególnych warunków zmiennych towarzyszących. Czy ma to kiedykolwiek sens? Na przykład (nie dotyczy modeli rejestrujących): M1: Y = X1 + X2 + X1*X2 M2: Y = X1 + X2 …

68 regression modeling interaction aic

4

Jak „zsumować” odchylenie standardowe?

Mam miesięczną średnią dla wartości i standardowe odchylenie odpowiadające tej średniej. Teraz obliczam średnią roczną jako sumę średnich miesięcznych. Jak mogę przedstawić odchylenie standardowe dla sumowanej średniej? Na przykład biorąc pod uwagę produkcję z farmy wiatrowej: Month MWh StdDev January 927 333 February 1234 250 March 1032 301 April 876 …

68 standard-deviation descriptive-statistics

10

Co jest złego w ekstrapolacji?

Pamiętam, jak siedziałem na kursach statystycznych jako studium słuchaczy o tym, dlaczego ekstrapolacja była złym pomysłem. Ponadto istnieje wiele źródeł online, które komentują to. Jest też wzmianka o niej tutaj . Czy ktoś może mi pomóc zrozumieć, dlaczego ekstrapolacja jest złym pomysłem? Jeśli tak, to dlaczego techniki prognozowania nie są …

68 regression time-series forecasting

2

Wieloczynnikowa regresja wielokrotna w R.

Mam 2 zmienne zależne (DV), na które na każdy wynik może mieć wpływ zestaw 7 zmiennych niezależnych (IV). DV są ciągłe, podczas gdy zestaw IV składa się z kombinacji zmiennych ciągłych i binarnie kodowanych. (W kodzie poniżej zmienne ciągłe są pisane dużymi literami, a zmienne binarne małymi literami.) Celem badania …

68 r multivariate-analysis manova multiple-regression multivariate-regression

7

Jak wygenerować równomiernie rozmieszczone punkty na powierzchni sfery trójwymiarowej?

Zastanawiam się, jak wygenerować równomiernie rozmieszczone punkty na powierzchni sfery jednostki 3-d? Również po wygenerowaniu tych punktów, jaki jest najlepszy sposób na wizualizację i sprawdzenie, czy są one naprawdę jednolite na powierzchni x2+y2+z2=1x2+y2+z2=1x^2+y^2+z^2=1 ?

68 random-generation

11

Dlaczego powinienem być Bayesianinem, gdy mój model jest zły?

Edycje: Dodałem prosty przykład: wnioskowanie o średniej XiXjaX_i . Wyjaśniłem też nieco, dlaczego wiarygodne przedziały niepasujące do przedziałów ufności są złe. Ja, dość pobożny Bayesjan, jestem w trakcie pewnego rodzaju kryzysu wiary. Mój problem jest następujący. Załóżmy, że chcę przeanalizować niektóre dane IID XiXjaX_i . Chciałbym: najpierw zaproponuj model warunkowy: …

68 bayesian modeling philosophical misspecification

1

W jaki sposób prosty model regresji logistycznej osiąga 92% dokładność klasyfikacji na MNIST?

Mimo że wszystkie obrazy w zestawie danych MNIST są wyśrodkowane, z podobną skalą i odkryte bez rotacji, mają znaczącą odmianę pisma ręcznego, która zastanawia mnie, w jaki sposób model liniowy osiąga tak wysoką dokładność klasyfikacji. O ile jestem w stanie sobie wyobrazić, biorąc pod uwagę znaczną różnorodność pisma ręcznego, cyfry …

68 logistic image-processing

1

40 000 artykułów neurobiologicznych może się mylić

Widziałem ten artykuł w „The Economist” na temat pozornie niszczącej pracy [1], podważającej „coś w rodzaju 40 000 opublikowanych badań [fMRI]”. Mówią, że błąd wynika z „błędnych założeń statystycznych”. Czytam artykuł i widzę, że jest to częściowo problem z wielokrotnymi korektami porównania, ale nie jestem ekspertem od fMRI i trudno …

67 hypothesis-testing multiple-comparisons spatial neuroimaging neuroscience

3

Czy to jest rozwiązanie problemu wartości p?

W lutym 2016 r. Amerykańskie stowarzyszenie statystyczne opublikowało formalne oświadczenie w sprawie istotności statystycznej i wartości p. Nasz wątek na ten temat obszernie omawia te problemy. Jednak do tej pory nie pojawił się żaden organ oferujący powszechnie uznaną skuteczną alternatywę. Amerykańskie Towarzystwo Statystyczne (ASS) opublikowało swoją odpowiedź, wartości p: Co …

67 hypothesis-testing statistical-significance p-value