Dzisiaj w Cross Validated Journal Club (dlaczego cię tam nie było?) @Mbq zapytał: Czy uważasz, że my (współcześni naukowcy danych) wiemy, co to znaczy? A jak to się ma do naszego zaufania do naszych wyników? @Michelle odpowiedziała, ponieważ niektórzy (w tym ja) zwykle: Coraz mniej pomocna jest mi koncepcja znaczenia …
Podczas prowadzenia badań w dziedzinie ekonomii często trzeba zweryfikować teoretyczne wnioski dotyczące rzeczywistych danych. Jakie są wiarygodne źródła danych, z których można korzystać i które można cytować? Interesują mnie głównie źródła, które dostarczają różnych danych statystycznych, takich jak PKB, populacja, CPI, PPI itp. EDYCJA: Oto agregacja linków pojawiających się w …
Sieci neuronowe są często traktowane jako „czarne skrzynki” ze względu na ich złożoną strukturę. Nie jest to idealne, ponieważ często korzystne jest intuicyjne zrozumienie, w jaki sposób model działa wewnętrznie. Jakie są metody wizualizacji działania wyszkolonej sieci neuronowej? Alternatywnie, w jaki sposób możemy wyodrębnić łatwo przyswajalne opisy sieci (np. Ten …
Załóżmy, że jest zmienną losową z pdf . Zatem zmienna losowa ma pdfXXXfX(x)fX(x)f_X(x)Y=X2Y=X2Y=X^2 fY(y)={12y√(fX(y√)+fX(−y√))0y≥0y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} Rozumiem rachunek za tym. Ale próbuję wymyślić sposób, aby wyjaśnić to komuś, kto nie zna rachunku różniczkowego. W szczególności próbuję wyjaśnić, dlaczego czynnik pojawia się z …
Szukam pewnych nierówności prawdopodobieństwa dla sum niezwiązanych zmiennych losowych. Byłbym bardzo wdzięczny, gdyby ktokolwiek mógł mi coś przekazać. Moim problemem jest znalezienie wykładniczej górnej granicy ponad prawdopodobieństwem, że suma niezwiązanych zmiennych losowych iid, które są w rzeczywistości pomnożeniem dwóch iidów Gaussa, przekracza pewną określoną wartość, tj. Pr[X≥ϵσ2N]≤exp(?)Pr[X≥ϵσ2N]≤exp(?)\mathrm{Pr}[ X \geq \epsilon\sigma^2 …
W tym semestrze mam kurs uczenia maszynowego, a profesor poprosił nas o znalezienie problemu w świecie rzeczywistym i rozwiązanie go jedną z metod uczenia maszynowego przedstawionych na zajęciach, takich jak: Drzewa decyzyjne Sztuczne sieci neuronowe Obsługa maszyn wektorowych Nauczanie oparte na instancjach ( kNN , LWL ) Bayesian Networks Uczenie …
Mam nadzieję, że ktoś wyjaśni laikowi, czym jest charakterystyczna funkcja i jak jest ona wykorzystywana w praktyce. Czytałem, że jest to transformata Fouriera w pdf, więc chyba wiem, co to jest, ale nadal nie rozumiem jej celu. Gdyby ktoś mógł podać intuicyjny opis jego przeznaczenia i być może przykład tego, …
Widzę, że istnieje wiele formalnych różnic między miarami odległości Kullback – Leibler vs. Kołmogorow-Smirnov. Oba są jednak używane do pomiaru odległości między rozkładami. Czy istnieje typowa sytuacja, w której należy użyć jednej zamiast drugiej? Jakie jest uzasadnienie tego?
Mam 2 proste pytania dotyczące regresji liniowej: Kiedy zaleca się ujednolicenie zmiennych objaśniających? Po przeprowadzeniu oszacowania ze znormalizowanymi wartościami, jak można przewidzieć nowe wartości (jak należy znormalizować nowe wartości)? Niektóre referencje byłyby pomocne.
Jak stwierdza pytanie - czy można udowodnić hipotezę zerową? Z mojego (ograniczonego) zrozumienia hipotezy odpowiedź brzmi „nie”, ale nie potrafię znaleźć dokładnego wyjaśnienia. Czy pytanie ma ostateczną odpowiedź?
We wszystkich kontekstach znam walidację krzyżową, która jest stosowana wyłącznie w celu zwiększenia dokładności predykcyjnej. Czy można rozszerzyć logikę walidacji krzyżowej przy szacowaniu obiektywnych związków między zmiennymi? Podczas gdy ten artykuł Richarda Berka demonstruje użycie trzymanej próbki do wyboru parametrów w „regresyjnym” modelu regresji (i pokazuje, dlaczego stopniowy wybór parametrów …
Jako osoba z zewnątrz wydaje się, że istnieją dwa konkurujące ze sobą poglądy na temat sposobu wnioskowania statystycznego. Czy dwie różne metody są uważane za ważne przez pracujących statystów? Czy wybranie jednego uważa się za bardziej filozoficzne pytanie? Czy też obecna sytuacja jest uważana za problematyczną i czy podejmowane są …
Pojawiło się kilka pytań dotyczących podręczników statystycznych , takich jak pytanie Bezpłatne podręczniki statystyczne . Jednak szukam podręczników o otwartym kodzie źródłowym, na przykład posiadających licencję Creative Commons . Powodem jest to, że w materiałach kursowych w innych domenach nadal chcesz zamieścić tekst o podstawowych statystykach. W takim przypadku byłoby …
Mój zestaw danych jest niewielki (120 próbek), jednak liczba funkcji jest duża i waha się od (1000-200 000). Chociaż dokonuję wyboru funkcji, aby wybrać podzbiór funkcji, może się ona nadal nadpisywać. Moje pierwsze pytanie brzmi: w jaki sposób SVM radzi sobie z nadmiernym dopasowaniem, jeśli w ogóle. Po drugie, kiedy …
Problem, który często pojawiałem się w kontekście sieci neuronowych, w szczególności sieci neuronowych, polega na tym, że są „głodne danych” - to znaczy, że nie działają one dobrze, chyba że mamy duży zestaw danych z którymi trenować sieć. Rozumiem, że wynika to z faktu, że sieci sieciowe, zwłaszcza sieci głębokie, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.