Czy podczas transformowania zmiennych musisz używać tej samej transformacji? Na przykład mogę wybrać i wybrać zmienne transformowane, jak w: Niech będzie wiekiem, długością zatrudnienia, długością pobytu i dochodem.x1,x2,x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) A może musisz być spójny ze swoimi transformacjami i używać tego samego? Jak w: Y …
Załóżmy, że otrzymujesz dwa obiekty, których dokładne lokalizacje są nieznane, ale są rozmieszczone zgodnie z normalnymi rozkładami o znanych parametrach (np. i b ∼ N ( v , t ) ) . Można założyć, obie są normalne dwuwymiarowe, takie, że pozycje są opisane przez rozkład w ( x , y …
Wielokrotnie czytałem / słyszałem, że wielkość próbki co najmniej 30 jednostek jest uważana za „dużą próbkę” (założenia dotyczące normalności środków zwykle w przybliżeniu zachowują się z powodu CLT, ...). Dlatego w moich eksperymentach zwykle generuję próbki 30 jednostek. Czy możesz podać mi odniesienie, które należy zacytować, gdy używasz próbki o …
Znam testy normalności, ale jak mam przetestować „Poissona”? Mam próbkę ~ 1000 nieujemnych liczb całkowitych, które, jak podejrzewam, pochodzą z rozkładu Poissona i chciałbym to przetestować.
Jeśli spojrzysz na Wolfram Alpha Lub ta strona w Wikipedii Lista krajów według mediany wieku Wyraźnie mediana wydaje się być statystyką wyboru, jeśli chodzi o wiek. Nie jestem w stanie wyjaśnić sobie, dlaczego średnia arytmetyczna byłaby gorszą statystyką. Dlaczego tak jest Pierwotnie opublikowane tutaj, ponieważ nie wiedziałem, że ta strona …
Jeśli dwie zmienne mają korelację 0, to dlaczego niekoniecznie są one niezależne? Czy zmienne skorelowane z zerami są niezależne w szczególnych okolicznościach? Jeśli to możliwe, szukam intuicyjnego wyjaśnienia, a nie wysoce technicznego.
Korzystam z klasyfikowania w Weka dla określonego zestawu danych i zauważyłem, że jeśli próbuję przewidzieć wartość nominalną, dane wyjściowe wyraźnie pokazują prawidłowe i niepoprawne wartości. Jednak teraz uruchamiam go dla atrybutu liczbowego, a wynikiem jest: Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared error 46.8547 Relative absolute error …
Obecnie przechodzę przez Losowe wyszukiwanie Bengio i Bergsta w celu optymalizacji hiperparametrów [1], w którym autorzy twierdzą, że losowe wyszukiwanie jest bardziej wydajne niż wyszukiwanie siatkowe w osiąganiu w przybliżeniu jednakowej wydajności. Moje pytanie brzmi: czy ludzie tutaj zgadzają się z tym twierdzeniem? W swojej pracy korzystałem z wyszukiwania siatki …
Czy istnieje głęboka różnica między rozkładem normalnym a rozkładem Gaussa, widziałem wiele dokumentów, które używają ich bez różnicy, i zwykle nazywam je również tym samym. Jednak mój PI niedawno powiedział mi, że normalny jest szczególnym przypadkiem Gaussa ze średnią = 0 i std = 1, co słyszałem również jakiś czas …
Chciałbym wiedzieć, jak interpretować różnicę wartości miary. Wiem, że miara f jest zrównoważonym środkiem między precyzją a pamięcią, ale pytam o praktyczne znaczenie różnicy w miarach F. Na przykład, jeśli klasyfikator C1 ma dokładność 0,4, a inny klasyfikator C2 dokładność 0,8, wówczas możemy powiedzieć, że C2 poprawnie sklasyfikował podwójność przykładów …
Przyznaję, że jestem stosunkowo nowy w ocenach skłonności i analizie przyczynowej. Jedną z rzeczy, która nie jest dla mnie oczywista jako nowicjusz, jest to, że „równoważenie” za pomocą wyników skłonności różni się matematycznie od tego, co dzieje się, gdy dodamy zmienne towarzyszące w regresji? Czym różni się operacja i dlaczego …
W szczególności zastanawiam się nad tym stwierdzeniem: Przyszłe główne wersje TensorFlow domyślnie umożliwią przepływ gradientów do danych wejściowych na etykietach. Który jest wyświetlany, gdy używam tf.nn.softmax_cross_entropy_with_logits. W tym samym komunikacie zachęca mnie do przyjrzenia się tf.nn.softmax_cross_entropy_with_logits_v2. Przejrzałem dokumentację, ale stwierdza tylko, że dla tf.nn.softmax_cross_entropy_with_logits_v2: Propagacja wstąpi na logi i etykiety. …
Mam wykształcenie informatyczne, ale staram się uczyć danych, rozwiązując problemy w Internecie. Pracowałem nad tym problemem przez ostatnie kilka tygodni (około 900 wierszy i 10 funkcji). Początkowo korzystałem z regresji logistycznej, ale teraz przerzuciłem się na losowe lasy. Kiedy uruchamiam mój przypadkowy model lasu na danych treningowych, otrzymuję naprawdę wysokie …
Załóżmy, że ϕ(⋅)ϕ(⋅)\phi(\cdot) i Φ(⋅)Φ(⋅)\Phi(\cdot) są funkcją gęstości i funkcją rozkładu standardowego rozkładu normalnego. Jak obliczyć całkę: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw
Dwie losowe zmienne A i B są statystycznie niezależne. Oznacza to, że w DAG procesu: i oczywiście P ( A | B ) = P ( A ) . Ale czy to oznacza również, że nie ma drzwi od B do A?( A ⊥⊥ B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P.( A | B …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.