Wysłałem to do mathoverflow i nikt nie odpowiada:
Metoda Scheffé do identyfikacji statystycznie istotnych kontrastów jest powszechnie znana. Kontrast wśród środków , o populacji jest liniową kombinacją w którym , a skalarna wielokrotność kontrastu jest zasadniczo tym samym kontrastem, więc można powiedzieć, że zestaw kontrastów jest przestrzenią rzutową. Metoda Scheffé'a testuje hipotezę zerową, która mówi, że wszystkie kontrasty między tymi populacjami wynosi , a biorąc pod uwagę poziom istotności , odrzuca hipotezę zerową z prawdopodobieństwem i = 1 , … , r r ∑ r i = 1 c i μ i ∑ r i = 1 c i = 00 α αbiorąc pod uwagę, że hipoteza zerowa jest prawdziwa. A jeśli hipoteza zerowa zostanie odrzucona, Scheffé wskazuje, że jego test mówi nam, które kontrasty różnią się znacznie od (nie jestem pewien, że artykuł w Wikipedii, który podłączyłem, wskazuje na to).
Chciałbym wiedzieć, czy można zrobić coś podobnego w innej sytuacji. Rozważ prosty model regresji liniowej , gdzie , .ε i ∼ i . i . d . N ( 0 , σ 2 ) i = 1 , … , n
Hipoteza zerowa, którą chcę rozważyć, dotyczy innego rodzaju kontrastu. Mówi, że nie ma podzbioru takiego, że dla i dla , gdzie . Jeśli podzbiór jest określony z góry, to robi to zwykły test dwiema próbkami , ale chcemy czegoś, co uwzględnia wszystkie podzbiory i ogranicza prawdopodobieństwo odrzucenia prawdziwej hipotezy zerowej.E ( Y i ) = α 1 + β x i i ∈ A E ( Y i ) = α 2 + β x i i ∉ A α 1 ≠ α 2 A t
Można by to zrozumieć, gdyby wydajność nie była problemem: znajdź test, który przejdzie wszystkie możliwości. Nawet wtedy jest to problematyczne; dwa kontrasty nie byłyby niezależne. Zapytałem o to eksperta w zakresie wykrywania wartości odstających, a on powiedział, że to koszmar kombinatoryczny. Następnie zapytałem, czy można udowodnić, że nie ma skutecznego sposobu, aby to zrobić, być może poprzez zmniejszenie do tego problemu trudnego NP. Powiedział tylko, że trzyma się z dala od problemów trudnych dla NP.
Więc: Czy można udowodnić, że ten problem jest „trudny”, czy nie?