Wybór priorytetów na podstawie błędu pomiaru


9

Jak obliczyć odpowiedni wcześniej, jeśli masz błąd pomiaru przyrządu? Ten akapit pochodzi z książki Cressie „Statistics for Spatio-Temporal Data”:

Często zdarza się, że dostępne są pewne wcześniejsze informacje dotyczące wariancji błędu pomiaru, co pozwala na określenie dość informacyjnego modelu parametrów. Na przykład, jeśli przyjmujemy warunkowo niezależne błędy pomiaru, które są takie jak , to powinniśmy podać informacyjny przed . Powiedzieć Byliśmy zainteresowani temperatury powietrza otoczenia, zauważyliśmy, że specyfikacji producenta urządzenia oznaczone „błąd” o ± 0,1 ° C . Zakładając, że ten „błąd” odpowiada 2 odchyleniom standardowym (założenie, które należy sprawdzić!), Moglibyśmy wówczas określić \ sigma _ {\ epsilon} ^ {2}, aby mieć wcześniejszą średnią (0,1 / 2) ^ 2 = 0,0025Gau(0,σϵ2)σϵ2±0.1°Cσϵ2(0.1/2)2=0.0025. Ze względu na specyfikację producenta przyrządu przyjęlibyśmy rozkład, który miał jasno określony i dość wąski pik przy 0,0025 (np. Odwrotna gamma). W rzeczywistości możemy po prostu naprawić na 0,0025; błąd modelu danych może jednak mieć także inne elementy niepewności (sekcja 7.1). Aby uniknąć możliwych problemów z identyfikowalnością z błędem modelu procesu, bardzo ważne jest, aby projektanci zredukowali niepewność tak bardzo, jak pozwala na to Science, w tym wykonując badania poboczne mające na celu odtworzenie danych.

Czy ktoś wie, jaka jest ogólna procedura uzyskiwania wartości uprzedniej, jak opisano powyżej (chociaż akapit odnosi się tylko do uzyskania średniej wcześniejszej)?

Odpowiedzi:


6

dwie standardowe metody

  1. Zapoznaj się ze „specyfikacjami producenta urządzenia”, jak wskazano w ofercie. Jest to zazwyczaj prymitywny rezerwowy sposób, który należy zastosować, gdy nie są dostępne żadne inne informacje, ponieważ (a) to, co twórca instrumentów naprawdę rozumie przez „dokładność” i „precyzja”, jest często nieokreślone oraz (b) jak zareagował przyrząd, gdy był nowy laboratorium testowe było prawdopodobnie znacznie lepsze niż w przypadku zastosowania w terenie.

  2. Zbierz próbki powtórzeń. W próbkowaniu środowiskowym istnieje około pół tuzina poziomów, na których próbki są rutynowo replikowane (i wiele innych, na których można je replikować), przy czym każdy poziom służy do kontroli możliwego do przypisania źródła zmienności. Takie źródła mogą obejmować:

    • Tożsamość osoby pobierającej próbkę.
    • Procedury wstępne, takie jak studzienki ratunkowe, wykonane przed pobraniem próbki.
    • Zmienność w fizycznym procesie pobierania próbek.
    • Heterogeniczność w obrębie samej próbki.
    • Zmiany, które mogą wystąpić podczas przechowywania i wysyłania próbki do laboratorium.
    • Różnice we wstępnych procedurach laboratoryjnych, takie jak homogenizacja próbki fizycznej lub trawienie jej do analizy.
    • Dane identyfikacyjne analityków laboratoryjnych.
    • Różnice między laboratoriami.
    • Różnice między fizycznie odrębnymi instrumentami, takimi jak dwa chromatografy gazowe.
    • Dryf w kalibracji przyrządu w czasie.
    • Odmiana dobowa. (Może to być naturalne i systematyczne, ale może wydawać się losowe, gdy czasy próbkowania są arbitralne).

Pełną ocenę ilościową składników zmienności można uzyskać jedynie poprzez systematyczne zmienianie każdego z tych czynników zgodnie z odpowiednim planem eksperymentalnym.

Zwykle badane są tylko te źródła, które mogą przyczynić się do największej zmienności. Na przykład wiele badań będzie systematycznie dzieliło pewną część próbek po ich uzyskaniu i wysyłało je do dwóch różnych laboratoriów. Badanie różnic między wynikami tych podziałów może obliczyć ich wkład w zmienność pomiaru. Jeśli uzyskano wystarczającą liczbę takich podziałów, pełny rozkład zmienności pomiaru można oszacować z góry w hierarchicznym bayesowskim modelu czasoprzestrzennym. Ponieważ wiele modeli zakładających rozkłady Gaussa (dla każdego z obliczeń), uzyskanie wcześniejszego Gaussa sprowadza się ostatecznie do oszacowania średniej i wariancji różnic między podziałami. W bardziej skomplikowanych badaniach, których celem jest zidentyfikowanie więcej niż jednego elementu wariancji,

Jedną z korzyści nawet myślenia o tych problemach jest to, że pomagają one zidentyfikować sposoby zmniejszenia lub nawet wyeliminowania niektórych z tych składników błędu (bez konieczności ich kwantyfikacji), przybliżając w ten sposób ideał Cressie & Wikle „zmniejszania niepewności” tyle, na ile pozwala nauka ”.

Aby zapoznać się z rozszerzonym przykładem działania (przy pobieraniu próbek gleby), patrz

Van Ee, Blume i Starks, Uzasadnienie oceny błędów w próbkowaniu gleb. US EPA, maj 1990 r .: EPA / 600 / 4-90 / 013.


2
Problem w tym, Robert, że czasami ktoś zgłosi standardowe odchylenie dla oszacowania; innym razem zgłaszają dwa razy (skąd podział na dwa) lub dwustronny przedział ufności; a czasem nawet coś innego; dlatego nie ma określonej reguły przekształcania deklaracji dokładności i precyzji w priory: należy zapoznać się z przypisami i innymi szczegółami technicznymi, aby dokładnie ustalić, co oznaczają liczby. Błąd standardowy oszacowania, będący funkcją wielkości użytej próbki, nie ma w tym przypadku znaczenia.
whuber

1
Rozumiem. Pozwól, że zmienię fokus na twoją drugą sprawę. Jeśli powtórzę eksperyment kilka razy i pomiary i , jak mogę wykorzystać te informacje do poinformowania o średniej i wariancji dla wcześniejszego rozkładu? Zasugerowałeś coś takiego jak na kilka podziałów, prawda? Dlatego miałbym średni błąd pomiaru i przykładowe odchylenie standardowe . Czy to wystarczy, aby zawrzeć go w poprzednim ? m1m2m1m2mϵσϵN(mϵ,σϵ2)
Robert Smith

1
Nie można ocenić dokładności za pomocą podziałów: w tym celu należy zmierzyć próbki znanych wartości. (W tym celu stosuje się kolce laboratoryjne i kolczaste duplikaty .) To określi średnią. Zwykle jest to obsługiwane podczas kalibracji procesu pomiaru, więc średnia przyjmuje się jako zero. Rozbieżność szacuje się na podstawie zwykłych wzorów ANOVA. Możesz użyć tego do określenia wcześniejszego elementu odpowiadającego komponentu systemu pomiarowego.
whuber

2
Nie tak: Odwołanie, które podałem, to wytyczne US EPA, które istnieją już od ćwierć wieku, a wiele najnowszych wskazówek opiera się na ich pomysłach. Kiedyś zastosowałem to podejście w federalnej sprawie sądowej, aby ocenić wpływ błędu pomiaru na narysowane linie konturu (w oparciu o predyktor geostatystyczny), aby wyznaczyć pióropusz zanieczyszczenia: błąd pomiaru był większy niż stężenie użyte do związania pióropuszu! (Innymi słowy, niepewność w
opisie

1
Bardzo miłe. Nawiasem mówiąc, chciałem powiedzieć, że przeorowie są zwykle ustawiani bez większej uwagi. Widziałem to bardziej wyraźnie w modelowaniu bayesowskim i uczeniu maszynowym, być może dlatego, że zgadywanie często wystarcza, aby uzyskać przyzwoite wyniki.
Robert Smith
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.