„Lepszy” jest funkcją twojego modelu.
Jednym z powodów tego zamieszania jest to, że napisałeś tylko połowę swojego modelu.
Kiedy mówisz , tak naprawdę nie jest to prawdą. Twoje zaobserwowane wartości nie są równe ; mają składnik błędu.y=axbyaxb
Na przykład dwa wspomniane modele (nie jedyne możliwe modele) przyjmują zupełnie inne założenia dotyczące błędu.
Prawdopodobnie czegoś bliżej .E(Y|X=x)=axb
Ale co zatem mówimy o odchyleniu od tego oczekiwania przy danym ? To ma znaczenie!Yx
Kiedy dopasowujesz model nieliniowego najmniejszego kwadratu, mówisz, że błędy sumują się, a standardowe odchylenie błędów jest stałe w danych:
yi∼N(axbi,σ2)
lub równoważnie
yi=axbi+ei , zvar(ei)=σ2
przeciwnie, gdy bierzesz dzienniki i dopasowujesz model liniowy, mówisz, że błąd jest addytywny w skali dziennika i (w skali dziennika) stały w danych. Oznacza to, że w skali obserwacji termin błędu jest multiplikatywny , a zatem błędy są większe, gdy oczekiwane wartości są większe:
yi∼logN(loga+blogxi,σ2)
lub równoważnie
yi=axbi⋅ηi , zηi∼logN(0,σ2)
(Zauważ, że nie jest 1. Jeśli jest mała, musisz pozwolić na ten efekt)E(η)σ2
(Możesz robić najmniejszych kwadratów bez zakładania rozkładów normalności / logarytmicznych, ale omawiany centralny problem nadal obowiązuje ... a jeśli nie jesteś w pobliżu normalności, prawdopodobnie powinieneś rozważyć inny model błędu)
To, co jest najlepsze, zależy od tego, jaki model błędu opisuje twoje okoliczności.
[Jeśli robisz jakąś analizę rozpoznawczą z pewnego rodzaju danych, który nie został dotąd, można by rozważyć pytania typu „Co twoje dane wyglądać? (Czyli wykreślono ? Co oznaczają reszty wyglądać przeciwko ? Z drugiej strony, jeśli takie zmienne nie są rzadkie, powinieneś już mieć informacje o ich ogólnym zachowaniu.]yxx