Ok, więc zamiast iść i wyprowadzić równanie Saundera (5), przedstawię je tutaj. Warunek 1 i 2 implikują następującą równość:
∏j=1m(∑k≠ihkdjk)=(∑k≠ihk)m−1(∑k≠ihk∏j=1mdjk)
gdzie
djk=P(Dj|Hk,I)hk=P(Hk|I)
Teraz możemy specjalizować się w sprawie (dwa zestawy danych), biorąc i ponownie oznaczając . Należy zauważyć, że te dwa zestawy danych nadal spełniają warunki 1 i 2, więc powyższy wynik dotyczy również ich. Rozwijając się teraz w przypadku , otrzymujemy:m=2D(1)1≡D1D(1)2≡D2D3…Dmm=2
(∑k≠ihkd1k)(∑l≠ihld2l)=(∑k≠ihk)(∑l≠ihld1ld2l)
→∑k≠i∑l≠ihkhld1kd2l=∑k≠i∑l≠ihkhld1ld2l
→∑k≠i∑l≠ihkhld2l(d1k−d1l)=0(i=1,…,n)
Termin występuje dwukrotnie w powyższym podwójnym sumowaniu, raz, gdy i , i jeszcze raz, gdy i . Stanie się tak długo, jak długo . Współczynnik każdego terminu podano przez i . Ponieważ istnieją z tych równań, możemy faktycznie usunąć z tych równań. Aby zilustrować się , A to oznacza, że mają wszystkie warunki z wyjątkiem gdzie i . Teraz weź(d1a−d1b)k=al=bk=bl=aa,b≠id2b−d2aiii=1a=1,b=2b=1,a=2i=3, i teraz możemy mieć te dwa warunki (zauważ, że zakłada to co najmniej trzy hipotezy). Tak więc równanie można zapisać ponownie jako:
∑l>khkhl(d2l−d2k)(d1k−d1l)=0
Teraz każdy z musi być większy od zera, ponieważ w przeciwnym razie mamy do czynienia z hipotezą , a odpowiedź można przeformułować w kategoriach . Można je więc usunąć z powyższego zestawu warunków:hin1<nn1
∑l>k(d2l−d2k)(d1k−d1l)=0
Zatem istnieją warunki , które muszą być spełnione, a każdy warunek implikuje jeden z dwóch „warunków podrzędnych”: że dla dowolnego lub (ale niekoniecznie oba). Teraz mamy zestaw wszystkich unikalnych par dla . Gdybyśmy wzięli z tych par dla jednej z , mielibyśmy wszystkie liczby w zbiorze i . Jest tak, ponieważ pierwsza para ma elementy, a każda dodatkowa para przynosi co najmniej jeden dodatkowy element do zestawu *n(n−1)2djk=djlj=1j=2(k,l)djk=djln−1j1,…,ndj1=dj2=⋯=dj,n−1=dj,n2
Należy jednak pamiętać, że ponieważ istnieją warunki , musimy wybrać co najmniej najmniejszą liczbę całkowitą większą lub równą dla jednego z lub . Jeżeli to liczba wybranych terminów jest większa niż . Jeśli lub , musimy wybrać dokładnie warunki . Oznacza to, że . Tylko w przypadku dwóch hipotez ( ) nie występuje to. Ale z ostatniego równania w artykule Saundera ten warunek równości implikuje:n(n−1)212×n(n−1)2=n(n−1)4j=1j=2n>4n−1n=4n=3n−1dj1=dj2=⋯=dj,n−1=dj,nn=2
P(Dj|H¯¯¯¯¯i)=∑k≠idjkhk∑k≠ihk=dji∑k≠ihk∑k≠ihk=dji=P(Dj|Hi)
Zatem w ilorazie prawdopodobieństwa mamy:
P(D(1)1|Hi)P(D(1)1|H¯¯¯¯¯i)=P(D1|Hi)P(D1|H¯¯¯¯¯i)=1 ORP(D(1)2|Hi)P(D(1)2|H¯¯¯¯¯i)=P(D2D3…,Dm|Hi)P(D2D3…,Dm|H¯¯¯¯¯i)=1
Aby ukończyć dowód, zauważ, że jeśli drugi warunek się utrzymuje, wynik jest już udowodniony, a tylko jeden współczynnik może różnić się od 1. Jeśli pierwszy warunek się utrzymuje, możemy powtórzyć powyższą analizę, ponownie oznaczając i . Wtedy nie wnosi wkładu, lub jest jedynym współtwórcą. Gdyby nie przyczynił się do wstrzymania, mielibyśmy wtedy trzecie oznakowanie i tak dalej. Zatem tylko jeden zestaw danych może przyczynić się do współczynnika prawdopodobieństwa, gdy warunek 1 i warunek 2 utrzymają się, i istnieją więcej niż dwie hipotezy.D(2)1≡D2D(2)2≡D3…,DmD1,D2D2D1D2
* UWAGA: Dodatkowa para może nie przynosić nowych warunków, ale zostanie to zrównoważone przez parę, która przyniosła 2 nowe warunki. np. weź jako pierwsze [+2], [+1] i [+0], ale następny termin musi mieć dla obu . Spowoduje to dodanie dwóch terminów [+2]. Jeśli , nie musimy już wybierać, ale dla „innego” musimy wybrać 3 pary, które nie są . Są to a zatem zachowuje się równość, ponieważ wszystkie liczby są w zbiorze.dj1=dj2dj1=dj3dj2=dj3djk=djlk,l∉(1,2,3)n=4j(1,2),(2,3),(1,3)(1,4),(2,4),(3,4)(1,2,3,4)