Dotychczasowe odpowiedzi koncentrowały się na samych danych , co ma sens w przypadku witryny, w której się znajduje, i wad w tym zakresie.
Ale z natury jestem epidemiologiem obliczeniowym / matematycznym, dlatego też zamierzam trochę porozmawiać o samym modelu, ponieważ ma on również znaczenie w dyskusji.
Moim zdaniem największym problemem z gazetą nie są dane Google. Modele matematyczne w epidemiologii cały czas przetwarzają niechlujne dane, a moim zdaniem problemy z nimi można rozwiązać za pomocą dość prostej analizy wrażliwości.
Dla mnie największym problemem jest to, że badacze „skazali się na sukces” - czegoś, czego zawsze należy unikać w badaniach. Robią to w modelu, który postanowili dopasować do danych: w standardowym modelu SIR.
W skrócie, model SIR (który oznacza podatne (S) zakaźne (I) odzyskane (R)) to szereg równań różniczkowych, które śledzą stany zdrowotne populacji, gdy doświadcza ona choroby zakaźnej. Zainfekowane osoby wchodzą w interakcje z podatnymi osobnikami i infekują je, a następnie z czasem przechodzą do odzyskanej kategorii.
To tworzy krzywą, która wygląda następująco:
Piękne, prawda? I tak, ten dotyczy epidemii zombie. Długa historia.
W tym przypadku czerwona linia jest modelowana jako „użytkownicy Facebooka”. Problem jest taki:
W podstawowym modelu SIR klasa I ostatecznie i nieuchronnie asymptotycznie zbliży się do zera .
To musi się zdarzyć. Nie ma znaczenia, czy modelujesz zombie, odrę, Facebook czy Stack Exchange itp. Jeśli modelujesz go za pomocą modelu SIR, nieunikniony wniosek jest taki, że populacja w klasie zakaźnej (I) spada do około zera.
Istnieją wyjątkowo proste rozszerzenia modelu SIR, które sprawiają, że to nieprawda - albo możesz sprawić, aby ludzie z klasy odzyskiwanej (R) wrócili do podatności (S) (w zasadzie byliby to ludzie, którzy opuścili Facebook zmieniając z „Jestem nigdy nie wracając „do„ Mogę kiedyś wrócić ”), albo możesz zaprosić nowych ludzi do populacji (to byłby mały Timmy i Claire zdobywający swoje pierwsze komputery).
Niestety autorzy nie pasowali do tych modeli. Nawiasem mówiąc, jest to szeroko rozpowszechniony problem w modelowaniu matematycznym. Model statystyczny jest próbą opisania wzorców zmiennych i ich interakcji w danych. Model matematyczny jest twierdzeniem o rzeczywistości . Możesz uzyskać model SIR pasujący do wielu rzeczy, ale wybór modelu SIR jest również stwierdzeniem o systemie. Mianowicie, że gdy osiągnie szczyt, zmierza do zera.
Nawiasem mówiąc, firmy internetowe używają modeli zatrzymywania użytkowników, które wyglądają jak modele epidemiczne, ale są również znacznie bardziej złożone niż ten przedstawiony w artykule.