Niedawno przyszedł do mnie klient, aby przeprowadzić analizę ładowania początkowego, ponieważ recenzent FDA stwierdził, że ich regresja błędów w zmiennych była nieprawidłowa, ponieważ podczas łączenia danych z witryn analiza obejmuje łączenie danych z trzech witryn, w których dwie witryny zawierały próbki, które były to samo.
TŁO
Klient miał nową metodę oznaczania, którą chciał wykazać jako „równoważną” z istniejącą zatwierdzoną metodą. Ich podejście polegało na porównaniu wyników obu metod zastosowanych do tych samych próbek. Do przeprowadzenia testów wykorzystano trzy strony. Błędy w zmiennych (regresja Deminga) zastosowano do danych w każdej witrynie. Chodzi o to, że jeśli regresja wykazała, że parametr nachylenia jest bliski 1, a punkt przecięcia w pobliżu 0, oznaczałoby to, że dwie techniki oznaczania dały prawie takie same wyniki, a zatem nowa metoda powinna zostać zatwierdzona. W miejscu 1 mieli 45 próbek, co dało im 45 sparowanych obserwacji. Witryna 2 zawierała 40 próbek, a witryna 3, 43 próbki. Dokonali trzech oddzielnych regresji Deminga (zakładając stosunek 1 dla błędów pomiaru dla dwóch metod). Algorytm zminimalizował więc sumę kwadratowych prostopadłych odległości.
W swoich uwagach klient wskazał, że niektóre próbki wykorzystane w miejscach 1 i 2 były takie same. W recenzji recenzent FDA stwierdził, że regresja Deminga była nieprawidłowa, ponieważ zastosowano wspólne próbki, co powoduje „interferencję”, która unieważnia założenia modelu. Zażądali zastosowania korekty ładowania początkowego do wyników Deminga, aby uwzględnić tę ingerencję.
W tym momencie, ponieważ klient nie wiedział, jak wykonać bootstrap, zostałem wprowadzony. Termin interferencja był dziwny i nie byłem pewien, do czego zmierza recenzent. Zakładałem, że tak naprawdę chodziło o to, że ponieważ w zbiorczych danych miały wspólne próbki, korelacja dla wspólnych próbek byłaby korelacyjna, a zatem warunki błędu modelu nie byłyby wszystkie niezależne.
ANALIZA KLIENTA
Trzy oddzielne regresje były bardzo podobne. Każdy z nich miał parametry nachylenia zbliżone do 1 i przechwytuje w pobliżu 0. 95% przedział ufności zawierał odpowiednio 1 i 0 dla nachylenia i przecięcia w każdym przypadku. Główną różnicą była nieco wyższa wariancja resztkowa w miejscu 3. Ponadto porównali to z wynikami z OLS i stwierdzili, że są one bardzo podobne (tylko w jednym przypadku przedział ufności dla nachylenia opartego na OLS nie zawierał 1). W przypadku, gdy OLS CI dla zbocza nie zawierał 1, górna granica przedziału wynosiła około 0,99.
Przy tak podobnych wynikach we wszystkich trzech witrynach łączenie danych witryny wydawało się rozsądne. Klient dokonał zbiorczej regresji Deminga, co również doprowadziło do podobnych wyników. Biorąc pod uwagę te wyniki, napisałem raport dla klienta kwestionującego twierdzenie, że regresje były nieważne. Moim argumentem jest to, że ponieważ w obu zmiennych występują podobne błędy pomiaru, klient miał rację, stosując regresję Deminga jako sposób wykazania zgody / niezgody. Poszczególne regresje strony nie miały problemów ze skorelowanymi błędami, ponieważ w danym miejscu nie powtarzano żadnych próbek. Łączenie danych w celu uzyskania krótszych przedziałów ufności.
Trudności tej można zaradzić, po prostu łącząc dane ze zwykłymi próbkami z witryny 1, o których mówi się, że pominięto. Również trzy indywidualne modele witryn nie mają problemu i są ważne. Wydaje mi się, że stanowi to mocny dowód zgody, nawet bez łączenia. Ponadto pomiary wykonano niezależnie w miejscach 1 i 2 dla miejsc wspólnych. Myślę więc, że nawet analiza zbiorcza wykorzystująca wszystkie dane jest poprawna, ponieważ błędy pomiarowe dla próbki w ośrodku 1 nie są skorelowane z błędami pomiarowymi w odpowiedniej próbce w ośrodku 2. To naprawdę sprowadza się do powtórzenia punktu w projekcie przestrzeń, która nie powinna stanowić problemu. Nie tworzy korelacji / „zakłóceń”.
W swoim raporcie napisałem, że analiza ładowania początkowego była niepotrzebna, ponieważ nie ma korelacji, którą należałoby dostosować. Trzy modele witryn były prawidłowe (brak możliwych „zakłóceń” w obrębie witryn) i można przeprowadzić analizę zbiorczą, usuwając typowe próbki w witrynie 1 podczas wykonywania puli. Taka zbiorcza analiza nie może mieć problemu z zakłóceniami. Dostosowanie bootstrapu nie byłoby konieczne, ponieważ nie ma tendencji do dostosowania.
WNIOSEK
Klient zgodził się z moją analizą, ale bał się zabrać ją do FDA. I tak chcą, żebym wyregulował bootstrap.
MOJE PYTANIA
A) Czy zgadzasz się z (1) moją analizą wyników klienta i (2) moim argumentem, że bootstrap jest zbędny.
B) Biorąc pod uwagę, że muszę załadować regresję Deminga, czy istnieją jakieś procedury SAS lub R, które są dla mnie dostępne, aby wykonać regresję Deminga na próbkach ładowania początkowego?
EDYCJA: Biorąc pod uwagę sugestię Billa Hubera, planuję przyjrzeć się granicom regresji błędów w zmiennych przez regresję zarówno y na x, jak i x na y. Wiemy już, że w przypadku jednej wersji OLS odpowiedź jest zasadniczo taka sama, jak błędy w zmiennych, gdy zakłada się, że dwie wariancje błędów są równe. Jeśli dotyczy to drugiej regresji, to myślę, że to pokaże, że regresja Deminga daje odpowiednie rozwiązanie. Czy sie zgadzasz?
Aby spełnić prośbę klienta, muszę wykonać żądaną analizę ładowania początkowego, która została niejasno zdefiniowana. Etycznie myślę, że błędem byłoby po prostu podanie paska startowego, ponieważ tak naprawdę nie rozwiązuje on prawdziwego problemu klienta, który uzasadnia procedurę pomiaru testu. Prześlę im obie analizy i poproszę przynajmniej, aby poinformowali FDA, że oprócz wykonania bootstrapu zrobiłem regresję odwrotną i ograniczyłem regresje Deminga, które moim zdaniem są bardziej odpowiednie. Sądzę również, że analiza ta pokaże, że ich metoda jest równoważna referencji, a zatem regresja Deminga jest również odpowiednia.
Planuję użyć programu R, który @whuber zasugerował w swojej odpowiedzi, aby umożliwić mi uruchomienie regresji Deminga. Nie znam się zbyt dobrze na R, ale myślę, że mogę to zrobić. Mam zainstalowany R wraz z R Studio. Czy to ułatwi wystarczająco nowicjuszowi jak ja?
Mam także SAS i jestem bardziej komfortowy w programowaniu w SAS. Więc jeśli ktoś zna sposób, aby to zrobić w SAS, byłbym wdzięczny za informację o tym.