Losowe przydzielanie jest cenne, ponieważ zapewnia niezależność leczenia od potencjalnych wyników. W ten sposób prowadzi do obiektywnych oszacowań średniego efektu leczenia. Ale inne schematy przydziału mogą również systematycznie zapewniać niezależność leczenia od potencjalnych wyników. Dlaczego więc potrzebujemy losowego przydziału? Innymi słowy, jaka jest przewaga losowego przypisywania nad nielosowymi schematami przypisywania, które również prowadzą do obiektywnego wnioskowania?
Pozwolić być wektorem przypisań do leczenia, w których każdy element ma wartość 0 (jednostka nieprzypisana do leczenia) lub 1 (jednostka przypisana do leczenia). W artykule JASA Angrist, Imbens i Rubin (1996, 446-47) mówią, że przypisanie do leczenia jest losowy, jeśli dla wszystkich i takich, że , gdzie to wektor kolumny ze wszystkimi elementami równymi 1 .
słowy, twierdzenie jest takie, że przypisanie jest losowe, jeśli jakikolwiek wektor przypisań, który obejmuje przypisań do leczenia, jest równie prawdopodobny, jak każdy inny wektor, który zawiera przypisań do leczenia.
Jednak w celu zapewnienia niezależności potencjalnych wyników od przypisania do leczenia wystarczy upewnić się, że każda jednostka w badaniu ma równe prawdopodobieństwo przypisania do leczenia. I może to łatwo nastąpić, nawet jeśli większość wektorów przydziału leczenia ma zerowe prawdopodobieństwo wyboru. Oznacza to, że może wystąpić nawet przy nielosowym przydziale.
Oto przykład. Chcemy przeprowadzić eksperyment z czterema jednostkami, w których traktowane są dokładnie dwie. Istnieje sześć możliwych wektorów przypisania:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
gdzie pierwsza cyfra w każdej liczbie wskazuje, czy pierwsza jednostka była leczona, druga cyfra wskazuje, czy druga jednostka była leczona i tak dalej.
Załóżmy, że przeprowadzamy eksperyment, w którym wykluczamy możliwość przypisania wektorów 3 i 4, ale w którym każdy z pozostałych wektorów ma równą (25%) szansę na wybranie. Ten schemat nie jest losowym przypisaniem w sensie AIR. Ale w oczekiwaniu prowadzi to do obiektywnego oszacowania średniego efektu leczenia. I to nie jest przypadek. Każdy schemat przydziału, który daje badanym równe prawdopodobieństwo przypisania do leczenia, pozwoli na obiektywne oszacowanie ATE.
Więc: dlaczego potrzebujemy losowego przypisania w sensie AIR? Mój argument jest oparty na wnioskowaniu losowym; jeśli zamiast tego myśli się w oparciu o wnioskowanie oparte na modelu, czy definicja AIR wydaje się bardziej możliwa do obrony?