To jest prosta sytuacja; niech tak pozostanie. Kluczem jest skupienie się na tym, co ważne:
Uzyskanie przydatnego opisu danych.
Ocena indywidualnych odchyleń od tego opisu.
Ocena możliwej roli i wpływu przypadku w interpretacji.
Utrzymanie integralności intelektualnej i przejrzystości.
Nadal istnieje wiele wyborów, a wiele form analizy będzie poprawnych i skutecznych. Zilustrujmy tutaj jedno podejście, które można zalecić ze względu na przestrzeganie tych kluczowych zasad.
Aby zachować integralność, podzielmy dane na połowy: obserwacje z lat 1972–1990 i te z lat 1991–2009 (każda po 19 lat). Dopasujemy modele do pierwszej połowy, a następnie zobaczymy, jak dobrze pasują do projekcji drugiej połowy. Ma to tę dodatkową zaletę, że wykrywa znaczące zmiany, które mogły wystąpić w drugiej połowie.
Aby uzyskać użyteczny opis, musimy (a) znaleźć sposób pomiaru zmian i (b) dopasować najprostszy możliwy model odpowiedni dla tych zmian, ocenić go i iteracyjnie dopasować bardziej złożone, aby uwzględnić odchylenia od prostych modeli.
(a) Masz wiele możliwości: możesz spojrzeć na surowe dane; możesz spojrzeć na ich roczne różnice; możesz zrobić to samo z logarytmami (aby ocenić zmiany względne); możesz ocenić lata utraty życia lub względną długość życia (RLE); lub wiele innych rzeczy. Po namyśle postanowiłem rozważyć RLE, zdefiniowane jako stosunek oczekiwanej długości życia w kohorcie B w stosunku do (referencyjnej) kohorty A. Na szczęście, jak pokazują wykresy, oczekiwana długość życia w kohorcie A regularnie rośnie w stabilnym mody w czasie, tak że większość losowo wyglądających zmian w RLE będzie spowodowana zmianami w kohorcie B.
(b) Najprostszym możliwym modelem na początek jest trend liniowy. Zobaczmy, jak to działa.
Ciemnoniebieskie punkty na tym wykresie to dane zachowane do dopasowania; punkty jasnozłote są kolejnymi danymi, nieużytymi do dopasowania. Czarna linia jest dopasowana, ze spadkiem 0,009 / rok. Linie przerywane to przedziały prognoz dla poszczególnych przyszłych wartości.
Ogólnie rzecz biorąc, dopasowanie wygląda dobrze: badanie pozostałości (patrz poniżej) nie wykazuje istotnych zmian w ich rozmiarach w czasie (w okresie danych 1972–1990). (Istnieją pewne oznaki, że były one większe na wczesnym etapie, kiedy oczekiwane życie było niskie. Moglibyśmy poradzić sobie z tym powikłaniem, poświęcając trochę prostoty, ale korzyści z oszacowania trendu raczej nie będą świetne.) Jest tylko najmniejsza wskazówka korelacji szeregowej (wykazywanej przez niektóre serie dodatnich i serie ujemnych reszt), ale najwyraźniej nie jest to ważne. Nie ma wartości odstających, na które wskazywałyby punkty poza przedziałami prognozowania.
Jedną niespodzianką jest to, że w 2001 r. Wartości nagle spadły do niższego przedziału prognozy i pozostały tam: stało się coś dość nagłego i dużego.
Oto reszty, które są odchyleniami od wspomnianego wcześniej opisu.
Ponieważ chcemy porównać reszty do 0, linie pionowe są rysowane do poziomu zerowego jako pomoc wizualna. Ponownie niebieskie punkty pokazują dane użyte do dopasowania. Jasnozłote są pozostałością danych spadających w pobliżu dolnej granicy prognozy po 2000 r.
Na podstawie tej liczby możemy oszacować, że efekt zmiany w latach 2000-2001 wyniósł około -0,07 . Odzwierciedla to nagły spadek o 0,07 (7%) pełnego okresu życia w kohorcie B. Po tym spadku poziomy wzorzec reszt wskazuje, że poprzedni trend trwał, ale na nowym niższym poziomie. Ta część analizy powinna zostać uznana za eksploracyjną : nie została specjalnie zaplanowana, ale wynikała z zaskakującego porównania między przetrzymywanymi danymi (1991–2009) a dopasowaniem do reszty danych.
Jeszcze jedno - nawet przy użyciu tylko 19 najwcześniejszych lat danych, standardowy błąd nachylenia jest niewielki: to tylko 0,0009, zaledwie jedna dziesiąta szacowanej wartości 0,009. Odpowiednia statystyka t wynosząca 10, z 17 stopniami swobody, jest niezwykle znacząca (wartość p jest mniejsza niż ); to znaczy, możemy być pewni, że ten trend nie wynika z przypadku. Jest to jedna z części naszej oceny roli przypadku w analizie. Pozostałe części to badania pozostałości.10−7
Wydaje się, że nie ma powodu, aby dopasować bardziej skomplikowany model do tych danych, przynajmniej nie w celu oszacowania, czy istnieje prawdziwy trend w RLE w czasie: jest taki. Moglibyśmy pójść dalej i podzielić dane na wartości sprzed 2001 r. I wartości po 2000 r. W celu dopracowania naszych szacunkówtrendów, ale przeprowadzanie testów hipotez nie byłoby całkowicie uczciwe. Wartości p byłyby sztucznie niskie, ponieważ testy podziału nie były wcześniej planowane. Ale jako ćwiczenie eksploracyjne takie oszacowanie jest w porządku. Dowiedz się wszystkiego, co możesz na podstawie danych! Uważaj tylko, aby nie oszukać siebie w przypadku nadmiernego dopasowania (co jest prawie pewne, że użyjesz więcej niż pół tuzina parametrów lub zastosujesz techniki automatycznego dopasowywania) lub szpiegowania danych: bądź czujny na różnicę między formalnym potwierdzeniem a nieformalnym (ale cenne) eksploracja danych.
Podsumujmy:
Wybierając odpowiednią miarę oczekiwanej długości życia (RLE), utrzymując połowę danych, dopasowując prosty model i testując ten model pod kątem pozostałych danych, z dużym przekonaniem ustaliliśmy, że : istniał stały trend; przez długi czas był zbliżony do liniowego; aw 2001 r. nastąpił nagły, trwały spadek RLE.
Nasz model jest uderzająco oszczędny : wymaga tylko dwóch liczb (nachylenie i punkt przecięcia), aby dokładnie opisać wczesne dane. Potrzebuje trzeciej (data przerwy, 2001), aby opisać oczywiste, ale nieoczekiwane odstępstwo od tego opisu. Nie ma wartości odstających w stosunku do tego opisu trzech parametrów. Model nie zostanie znacząco ulepszony poprzez scharakteryzowanie szeregowej korelacji (zasadniczo w technikach szeregów czasowych), próbie opisania małych indywidualnych odchyleń (reszt) wykazanych lub wprowadzenia bardziej skomplikowanych dopasowań (takich jak dodanie kwadratowego składnika czasu) lub modelowanie zmian wielkości reszt w czasie).
Trend wynosił 0,009 RLE rocznie . Oznacza to, że z każdym mijającym rokiem oczekiwana długość życia w kohorcie B zwiększa się o 0,009 (prawie 1%) pełnego oczekiwanego normalnego okresu życia. W trakcie badania (37 lat) wyniósłoby to 37 * 0,009 = 0,34 = jedna trzecia pełnej poprawy w ciągu całego życia. Niepowodzenie w 2001 r. Zmniejszyło ten zysk do około 0,28 pełnego okresu życia od 1972 do 2009 r. (Mimo że w tym okresie oczekiwana długość życia wzrosła o 10%).
Chociaż ten model mógłby zostać ulepszony, prawdopodobnie potrzebowałby więcej parametrów, a poprawa prawdopodobnie nie będzie świetna (jak potwierdza prawie losowe zachowanie resztek). Ogólnie rzecz biorąc, powinniśmy zadowalać się opracowaniem tak zwartego, użytecznego, prostego opisu danych przy tak małej pracy analitycznej.