Pytania otagowane jako linear-model

Odnosi się do dowolnego modelu, w którym zmienna losowa jest powiązana z jedną lub większą liczbą zmiennych losowych przez funkcję, która jest liniowa w skończonej liczbie parametrów.

2
Rzucanie wielowymiarowego modelu liniowego jako regresji wielokrotnej
Czy przekształcenie wielowymiarowego modelu regresji liniowej jako wielokrotnej regresji liniowej jest całkowicie równoważne? Ja nie odnosząc się po prostu działa ttt oddzielnych regresji. Przeczytałem o tym w kilku miejscach (Bayesian Data Analysis - Gelman i wsp. Oraz Multivariate Old School - Marden), że wielowymiarowy model liniowy można łatwo sparametryzować jako …

1
Dobroć dopasowania i który model wybrać regresję liniową lub Poissona
Potrzebuję porady dotyczącej dwóch głównych dylematów w moich badaniach, które są studium przypadku 3 dużych farmaceutyków i innowacji. Liczba patentów rocznie jest zmienną zależną. Moje pytania są Jakie są najważniejsze kryteria dobrego modelu? Co jest ważniejsze / mniej ważne? Czy to, że większość lub wszystkie zmienne będą znaczące? Czy to …

1
Warunkowe oczekiwanie na R-kwadrat
Rozważ prosty model liniowy: yy=X′ββ+ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon gdzie ϵi∼i.i.d.N(0,σ2)ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2) i X∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p} ,p≥2p≥2p\geq2 aXXX zawiera kolumnę stałych. My pytanie, ponieważ E(X′X)E(X′X)\mathrm{E}(X'X) , ββ\beta i σσ\sigma , ma wzór o nie trywialne górną granicę E(R2)E(R2)\mathrm{E}(R^2) *? (przy założeniu, że model został oszacowany przez OLS). * Przypuszczałem, pisząc to, że coraz E(R2)E(R2)E(R^2) sama w …


2
Dlaczego rozkład T jest wykorzystywany do hipotez testujących współczynnik regresji liniowej?
W praktyce powszechne jest stosowanie standardowego testu T do sprawdzenia znaczenia współczynnika regresji liniowej. Mechanika obliczeń ma dla mnie sens. Dlaczego rozkład T można wykorzystać do modelowania standardowej statystyki testowej stosowanej w testowaniu hipotez regresji liniowej? Standardowa statystyka testu, o której mowa tutaj: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

2
Dlaczego GLM różni się od LM z transformowaną zmienną
Jak wyjaśniono w tym podręczniku kursu (strona 1) , model liniowy można zapisać w postaci: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, gdzie jest zmienną odpowiedzi, a jest zmienną objaśniającą .yyyxixix_{i}ithithi^{th} Często w celu spełnienia założeń testowych można przekształcić zmienną odpowiedzi. Na przykład, stosujemy funkcję …

4
Klasyczny model liniowy - wybór modelu
Mam klasyczny model liniowy z 5 możliwymi regresorami. Nie są ze sobą skorelowane i mają dość niską korelację z odpowiedzią. Doszedłem do modelu, w którym 3 regresory mają znaczące współczynniki dla ich statystyki t (p <0,05). Dodanie jednej lub obu pozostałych 2 zmiennych daje wartości p> 0,05 dla statystyki t, …

2
Notacja macierzowa dla regresji logistycznej
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …

3
Kiedy możemy mówić o kolinearności
W modelach liniowych musimy sprawdzić, czy istnieje relacja między zmiennymi objaśniającymi. Jeśli korelują one zbyt mocno, występuje kolinearność (tzn. Zmienne częściowo się wyjaśniają). Właśnie patrzę właśnie na korelację par pomiędzy każdą z zmiennych objaśniających. Pytanie 1: Co klasyfikuje jako zbyt dużą korelację? Na przykład, czy korelacja Pearsona o 0,5 jest …

1
Zrozumienie rozkładu QR
Mam sprawdzony przykład (w R), który próbuję zrozumieć dalej. Używam Limmy do stworzenia modelu liniowego i staram się zrozumieć, co dzieje się krok po kroku w obliczeniach zmiany zagięcia. Głównie próbuję dowiedzieć się, co się dzieje, aby obliczyć współczynniki. Z tego, co mogę zrozumieć, rozkład QR jest używany do uzyskania …

5
Czy mogę zignorować współczynniki dla nieistotnych poziomów czynników w modelu liniowym?
Po szukaniu wyjaśnienia na temat współczynników modeli liniowych tutaj mam pytanie uzupełniające dotyczące braku oznakowania (wysoka wartość p) dla współczynników poziomów czynników. Przykład: jeśli mój model liniowy zawiera współczynnik z 10 poziomami, a tylko 3 z tych poziomów mają powiązane z nimi znaczące wartości p, to przy użyciu modelu do …

2
VIF, indeks stanu i wartości własne
Obecnie oceniam wielokoliniowość w moich zestawach danych. Jakie wartości progowe VIF i wskaźnika stanu poniżej / powyżej sugerują problem? VIF: Słyszałem, że VIF jest problemem.≥ 10≥10\geq 10 Po usunięciu dwóch zmiennych problemowych VIF wynosi dla każdej zmiennej. Czy zmienne wymagają dalszego leczenia, czy też ten VIF wydaje się w porządku?≤ …

3
Czy w przypadku klasyfikatorów liniowych większe współczynniki implikują ważniejsze cechy?
Jestem inżynierem oprogramowania zajmującym się uczeniem maszynowym. Z mojego zrozumienia, regresja liniowa (taka jak OLS) i klasyfikacja liniowa (taka jak regresja logistyczna i SVM) przewidują na podstawie iloczynu wewnętrznego między wyuczonymi współczynnikami a zmiennymi funkcji :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ )=f(∑iwixi)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) = f(\sum_{i} w_i x_i) …



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.