Pytania otagowane jako regression

Techniki analizy zależności między jedną (lub więcej) zmiennymi „zależnymi” a zmiennymi „niezależnymi”.





7
Losowy las jest przepełniony
Próbuję użyć losowej regresji leśnej w scikits-learn. Problem polega na tym, że otrzymuję naprawdę wysoki błąd testu: train MSE, 4.64, test MSE: 252.25. Tak wyglądają moje dane: (niebieski: dane rzeczywiste, zielony: przewidywane): Używam 90% na szkolenie i 10% na test. Oto kod, którego używam po wypróbowaniu kilku kombinacji parametrów: rf …

1
Regresja błędów w zmiennych: czy poprawne jest łączenie danych z trzech witryn?
Niedawno przyszedł do mnie klient, aby przeprowadzić analizę ładowania początkowego, ponieważ recenzent FDA stwierdził, że ich regresja błędów w zmiennych była nieprawidłowa, ponieważ podczas łączenia danych z witryn analiza obejmuje łączenie danych z trzech witryn, w których dwie witryny zawierały próbki, które były to samo. TŁO Klient miał nową metodę …

3
Zautomatyzowana procedura wyboru podzbioru punktów danych z najsilniejszą korelacją?
Czy istnieje jakaś standardowa procedura (taka, że ​​można ją przytoczyć jako odniesienie) do wybierania podzbioru punktów danych z większej puli o największej korelacji (tylko w dwóch wymiarach)? Załóżmy na przykład, że masz 100 punktów danych. Potrzebujesz podzbioru 40 punktów o najsilniejszej możliwej korelacji wzdłuż wymiarów X i Y. Zdaję sobie …

2
Jak wybrać pomiędzy różnymi Skorygowane
Mam na myśli skorygowane wzory R-kwadrat zaproponowane przez: Ezekiel (1930), który moim zdaniem jest obecnie używany w SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Olkin and Pratt (1958) R2unbiased=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)Runbiased2=1−(N−3)(1−R2)(N−p−1)−2(N−3)(1−R2)2(N−p−1)(N−p+1)R^2_{\rm unbiased} = 1 - \frac{(N-3)(1-R^2)}{(N-p-1)} - \frac{2(N-3)(1-R^2)^2}{(N-p-1)(N-p+1)} W jakich okolicznościach (jeśli w ogóle) powinienem preferować „dostosowane” do „obiektywnych” ?R2R2R^2 Bibliografia …



5
Jak modelować ceny?
Zadałem to pytanie na stronie stosu wymiany matematyki i polecono mi tutaj. Pracuję nad projektem hobby i potrzebuję pomocy w rozwiązaniu następującego problemu. Trochę kontekstu Załóżmy, że istnieje kolekcja przedmiotów z opisem funkcji i ceną. Wyobraź sobie listę samochodów i cen. Wszystkie samochody mają listę funkcji, np. Wielkość silnika, kolor, …


5
Czy można zastosować regresję wielokrotną, aby przewidzieć jeden główny składnik (PC) z kilku innych komputerów?
Jakiś czas temu użytkownik na liście dyskusyjnej R-help zapytał o zasadność korzystania z wyników PCA w regresji. Użytkownik próbuje użyć wyników komputerowych w celu wyjaśnienia różnic na innym komputerze (patrz pełna dyskusja tutaj ). Odpowiedź brzmiała: nie, to nie jest dźwięk, ponieważ komputery PC są do siebie prostopadłe. Czy ktoś …
15 regression  pca 


5
Jaka jest potrzeba założeń w regresji liniowej?
W regresji liniowej przyjmujemy następujące założenia Średnia odpowiedzi, E(Yi)E(Yi)E(Y_i) , dla każdego zestawu wartości predyktorów (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) , jest funkcją liniową predyktorów. Błędy εiεiε_i są niezależne. Błędy εiεiε_i dla każdego zestawu wartości predyktorów (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) są rozkładem normalnym. Błędy dla każdego zestawu wartości predyktorów mają jednakowe wariancje (oznaczone σ2 ).εiεiε_i(x1i,x2i,…)(x1i,x2i,…)(x_{1i}, …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.