Odnosi się do dowolnego modelu, w którym zmienna losowa jest powiązana z jedną lub większą liczbą zmiennych losowych przez funkcję, która jest liniowa w skończonej liczbie parametrów.
Czy przekształcenie wielowymiarowego modelu regresji liniowej jako wielokrotnej regresji liniowej jest całkowicie równoważne? Ja nie odnosząc się po prostu działa ttt oddzielnych regresji. Przeczytałem o tym w kilku miejscach (Bayesian Data Analysis - Gelman i wsp. Oraz Multivariate Old School - Marden), że wielowymiarowy model liniowy można łatwo sparametryzować jako …
Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że większość lub wszystkie zmienne będą znaczące? Czy to …
Rozważ prosty model liniowy: yy=X′ββ+ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon gdzie ϵi∼i.i.d.N(0,σ2)ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2) i X∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p} ,p≥2p≥2p\geq2 aXXX zawiera kolumnę stałych. My pytanie, ponieważ E(X′X)E(X′X)\mathrm{E}(X'X) , ββ\beta i σσ\sigma , ma wzór o nie trywialne górną granicę E(R2)E(R2)\mathrm{E}(R^2) *? (przy założeniu, że model został oszacowany przez OLS). * Przypuszczałem, pisząc to, że coraz E(R2)E(R2)E(R^2) sama w …
Przeszkoliłem model regresji liniowej, używając zestawu zmiennych / cech. A model ma dobrą wydajność. Zrozumiałem jednak, że nie ma zmiennej o dobrej korelacji z przewidywaną zmienną. Jak to jest możliwe?
W praktyce powszechne jest stosowanie standardowego testu T do sprawdzenia znaczenia współczynnika regresji liniowej. Mechanika obliczeń ma dla mnie sens. Dlaczego rozkład T można wykorzystać do modelowania standardowej statystyki testowej stosowanej w testowaniu hipotez regresji liniowej? Standardowa statystyka testu, o której mowa tutaj: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}
Jak wyjaśniono w tym podręczniku kursu (strona 1) , model liniowy można zapisać w postaci: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, gdzie jest zmienną odpowiedzi, a jest zmienną objaśniającą .yyyxixix_{i}ithithi^{th} Często w celu spełnienia założeń testowych można przekształcić zmienną odpowiedzi. Na przykład, stosujemy funkcję …
Mam klasyczny model liniowy z 5 możliwymi regresorami. Nie są ze sobą skorelowane i mają dość niską korelację z odpowiedzią. Doszedłem do modelu, w którym 3 regresory mają znaczące współczynniki dla ich statystyki t (p <0,05). Dodanie jednej lub obu pozostałych 2 zmiennych daje wartości p> 0,05 dla statystyki t, …
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …
W modelach liniowych musimy sprawdzić, czy istnieje relacja między zmiennymi objaśniającymi. Jeśli korelują one zbyt mocno, występuje kolinearność (tzn. Zmienne częściowo się wyjaśniają). Właśnie patrzę właśnie na korelację par pomiędzy każdą z zmiennych objaśniających. Pytanie 1: Co klasyfikuje jako zbyt dużą korelację? Na przykład, czy korelacja Pearsona o 0,5 jest …
Mam sprawdzony przykład (w R), który próbuję zrozumieć dalej. Używam Limmy do stworzenia modelu liniowego i staram się zrozumieć, co dzieje się krok po kroku w obliczeniach zmiany zagięcia. Głównie próbuję dowiedzieć się, co się dzieje, aby obliczyć współczynniki. Z tego, co mogę zrozumieć, rozkład QR jest używany do uzyskania …
Po szukaniu wyjaśnienia na temat współczynników modeli liniowych tutaj mam pytanie uzupełniające dotyczące braku oznakowania (wysoka wartość p) dla współczynników poziomów czynników. Przykład: jeśli mój model liniowy zawiera współczynnik z 10 poziomami, a tylko 3 z tych poziomów mają powiązane z nimi znaczące wartości p, to przy użyciu modelu do …
Obecnie oceniam wielokoliniowość w moich zestawach danych. Jakie wartości progowe VIF i wskaźnika stanu poniżej / powyżej sugerują problem? VIF: Słyszałem, że VIF jest problemem.≥ 10≥10\geq 10 Po usunięciu dwóch zmiennych problemowych VIF wynosi dla każdej zmiennej. Czy zmienne wymagają dalszego leczenia, czy też ten VIF wydaje się w porządku?≤ …
Jestem inżynierem oprogramowania zajmującym się uczeniem maszynowym. Z mojego zrozumienia, regresja liniowa (taka jak OLS) i klasyfikacja liniowa (taka jak regresja logistyczna i SVM) przewidują na podstawie iloczynu wewnętrznego między wyuczonymi współczynnikami a zmiennymi funkcji :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ )=f(∑iwixi)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) = f(\sum_{i} w_i x_i) …
Więc bawiłem się SVM i zastanawiam się, czy to dobra rzecz: Mam zestaw funkcji ciągłych (od 0 do 1) i zestaw cech kategorycznych, które przekonwertowałem na zmienne obojętne. W tym konkretnym przypadku koduję datę pomiaru w zmiennej zastępczej: Są 3 okresy, z których mam dane i zarezerwowałem dla nich 3 …
Powiedzmy, że mam N obserwacji, być może wiele czynników, i powtarzam każdą obserwację dwa razy (lub M razy), jak regresja na tym nowym zestawie wielkości NM porównałaby się z regresją na samych oryginalnych obserwacjach?
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.