Jak określić prawdopodobieństwo awarii, jeśli nie wystąpiły awarie?


50

Zastanawiałem się, czy istnieje sposób na określenie prawdopodobieństwa wystąpienia awarii (produktu), jeśli mamy 100 000 produktów w terenie przez 1 rok i bez żadnych awarii? Jakie jest prawdopodobieństwo, że jeden z następnych 10 000 sprzedanych produktów zawiedzie?


4
Coś mi mówi, że to nie jest prawdziwy problem z niezawodnością. Nie ma produktów o tak niskiej awaryjności.
Aksakal

Potrzebujesz modelu podziału możliwych wskaźników sukcesu / niepowodzenia, zanim będziesz mógł wywnioskować cokolwiek, od statystyk po prawdopodobieństwa rzeczywistych wskaźników sukcesu / niepowodzenia. Twój opis daje bardzo niewiele podstaw do wnioskowania / zakładania takiego rozkładu.
RBarryYoung

1
@RBarryYoung proszę sprawdzić dostarczone odpowiedzi - podają kilka interesujących i ważnych podejść do problemu. Jeśli nie zgadzasz się z tymi podejściami, możesz je skomentować lub podać własną odpowiedź.
Tim

2
@Aksakal - tak niski wskaźnik awaryjności nie wydaje się niemożliwy, jeśli jest to prosty produkt o wysokiej wartości i tak wysokim ryzyku w przypadku awarii (jak instrument chirurgiczny), że przechodzi on poziomy testowania i kontroli (i być może niezależny certyfikacja) przed wydaniem. Oczywiście może być odwrotnie, produkt może mieć tak niską wartość, że użytkownicy końcowi po prostu nie zgłaszają problemów z wadliwymi produktami (z pewnością producenci gumball mają mniej niż 1/100000 zgłoszonych wskaźników wad?), Konsument po prostu odrzuca i próbuje nowego.
Johnny

@Johnny, kiedy Motorola wymyśliła , przechwalali się, że na 100 milionów produktów występują 3 awarie lub coś w tym rodzaju. 6σ
Aksakal

Odpowiedzi:


43

Prawdopodobieństwo awarii produktu jest z pewnością funkcją czasu i wykorzystania. Nie mamy żadnych danych na temat użytkowania, a tylko jeden rok nie ma żadnych awarii (gratulacje!). Zatem tego aspektu (zwanego funkcją przeżycia ) nie można oszacować na podstawie danych.

Można jednak pomyśleć o awariach w ciągu jednego roku, które czerpią z rozkładu dwumianowego . Nadal nie ma awarii, ale jest to obecnie powszechny problem. Prostym rozwiązaniem jest użycie reguły 3 , która jest dokładna przy dużych (które z pewnością masz). W szczególności, można uzyskać górna granica jednostronnego 95% przedziału ufności (czyli dolna granica wynosi ) na prawdziwej prawdopodobieństwo awarii w ciągu roku jako . W twoim przypadku masz 95% pewności, że stawka jest mniejsza niż . 0 3 / N 0,00003N03/N0.00003

Pytałeś także, jak obliczyć prawdopodobieństwo, że jedno lub więcej z następnych 10k ulegnie awarii. Szybkim i prostym (aczkolwiek ekstremalnym) sposobem na rozszerzenie powyższej analizy jest po prostu użycie górnej granicy jako podstawowego prawdopodobieństwa i użycie odpowiedniego dwumianowego CDF, aby uzyskać prawdopodobieństwo, że nie będzie awarii. Za pomocą kodu możemy wykonać :, co daje szansę na zobaczenie jednej lub więcej awarii w następnych 10 000 produktach. Wykorzystując górną granicę, nie jest to optymalny punktowy szacunek prawdopodobieństwa wystąpienia co najmniej jednej awarii, można raczej powiedzieć, że jest bardzo mało prawdopodobne, aby prawdopodobieństwo awarii było większe niż1 26 % ( M + 1 ) / ( N + 2 ) K P = 9,9998 x 10 - 06 1 +10 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(uznając, że jest to nieco „falista ręka”). Inną możliwością jest skorzystanie z sugestii @ amoeba dotyczącej oszacowania z reguły sukcesji Laplace'a . Zasada sukcesji mówi, że szacowane prawdopodobieństwo awarii wynosi , gdzie jest liczbą awarii. W takim przypadku , a obliczenia dla przewidywanego prawdopodobieństwa awarii w następnych 10 000 wynoszą , uzyskując , lub . (F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1. Nie słyszałem wcześniej o „zasadzie 3”. Zastanawiam się, czy istnieje jakikolwiek związek między regułą 3 a „regułą sukcesji Laplace'a”? Zgodnie z tym ostatnim (jeśli zastosuję go poprawnie) prawdopodobieństwo awarii można oszacować jako . 1/(N+2)
ameba mówi Przywróć Monikę

14
@amoeba Ta reguła 3 stanowi 95% jednostronny limit zaufania. Załóżmy, że liczba awarii ma rozkład dwumianowy . Zatem szansa na brak awarii wynosi . Aby uzyskać więcej niż , rozwiąż dla . Używając dla małego , rozwiązaniem jest . Ponieważ , otrzymujemy . To jest „zasada 3”. Warto wiedzieć, ponieważ teraz wiesz, jak zmieniać „3”, jeśli chcesz dostosować poziom ufności, a także możesz go odwrócić, aby znaleźć minimum potrzebne do wykrycia wskaźnika( 1 - P ) n 5 % ( 1 - P ) n0,05 s log ( 1 - P ) - P P P - log ( 0,05 ) / n 0,05 = 1 / 20 e 3 s 3 / n n p(n,p)(1p)n5%(1p)n0.05plog(1p)ppplog(0.05)/n0.05=1/20e3p3/nnp lub więcej.
whuber

1
@amoeba, jak wspomniałem, wziąłem mundur przed prawdopodobieństwem awarii. Uważam, że inny przełożony prowadziłby do znacznie różnych rezultatów.
Yair Daon,

1
Twój postęp jest dobry (+1). Rodzi to jednak problemy interpretacyjne. Nie jesteśmy „pewni”, że szansa nie przekracza ponieważ nie jesteśmy całkowicie pewni prawdziwej leżącej u podstaw szansy. Nie mamy „górnej granicy” na , ale jedynie górny limit ufności. Kiedy podajesz prognozy dotyczące przyszłego zdarzenia, musisz (a) oszacować je i (b) podać granice. Spójrz na to w ten sposób: daj nam granice gdy , niezależnie, zależnie od . Granice te są przedział przewidywania dla w oparciu o .p Y X Dwumianowy ( n , p ) Y Dwumianowy ( m , p ) X = 0 Y X26%pYXBinomial(n,p)YBinomial(m,p)X=0YX
whuber

2
Yay za „Regułę trzech”. Pięść widziałem to wiele lat temu w krótkiej notatce do „Journal of American Medical Association” jama.jamanetwork.com/article.aspx?articleid=385438
DW

25

Możesz przyjąć podejście bayesowskie. oznacz prawdopodobieństwo błędu przez i to jako zmienną losową. A priori, zanim zobaczysz wyniki eksperymentów, możesz uwierzyć, że . Jeśli ufasz inżynierom, że ten produkt jest niezawodny, być może możesz wziąć lub mniej więcej. To zależy od Ciebie. Następnie możesz użyć twierdzenia Bayesa, aby obliczyć rozkład tylny . Oznaczmy zdarzenie, które zostały zaobserwowane ( eksperymenty zero porażek).Θ U ( 0 , 1 ) Θ U ( 0 , 0,1 ) θ A nΘΘU(0,1)ΘU(0,0.1)θAn

Θp(θ)np(A|θ)nθ

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Wszystko jest proste: jest jednolite, więc jest stałe. Ponieważ przeprowadzasz eksperymentów, jest tylko prawdopodobieństwem braku błędów w próbach bernouli z prawdopodobieństwem niepowodzenia .Θp(θ)np(A|θ)nθ

Gdy masz , jesteś złoty: możesz obliczyć prawdopodobieństwo dowolnego zdarzenia przez całkowanie:B P ( B ) = p ( B | θ ) p ( θ | A ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Poniżej omawiam szczegółowe rozwiązanie, zgodnie z powyższym podejściem. Przyjmę kilka standardowych skrótów.

Niech przedtem będzie . Następnie: Stała normalizacji wynosi - patrz funkcja beta stron wikipedia i rozkład beta . Zatem , który jest rozkładem beta o parametrach .p ( θ | A ) p ( A | θ ) 1 = ( 1 - θ ) n . p ( A ) = p ( A | θ ) p ( θ ) d θ B ( 1 , n + 1 ) p ( θ | A )U(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθB(1,n+1) 1,n+1p(θ|A)=(1θ)nB(1,n+1)1,n+1

Oznaczają prawdopodobieństwo bez porażek w produktów w następnym roku przez . Prawdopodobieństwo co najmniej jednego niepowodzenia wynosi . Następnie B 1 - P ( B ) 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

co wynosi w przybliżeniu , przy użyciu . Niezbyt imponujące? Przyjąłem jednolity rozkład prawdopodobieństwa awarii. Być może lepiej wierzysz swoim inżynierom.N = 100 , 000 , m = 10 , 0000.1n=100,000,m=10,000


3
Dziwne wydaje się, że tak mało brakuje rzeczywistego rozwiązania tak prostego problemu, zwłaszcza gdy metoda wygląda tak obiecująco. Czy sugerujesz, że obliczenia są trudne?
whuber

2
@ whuber Nie zapomniałem o tym, myślałem, że ten ostatni krok jest oczywisty. To, co rozumiem przez „nieudolny”, to to, że 10% prawdopodobieństwo awarii jest wciąż duże, w porównaniu z brakiem awarii w pierwszych 100 000 przebiegach. Ponadto, dzięki za komentarz dotyczący par sprzężonych, pomyślałem, że może to pomylić OP i odwrócić ich uwagę od tego, co ważne, dlatego go pominąłem.
Yair Daon

3
Oczywiście, tak - ale kiedy skończysz na wartości 0,9, liczba ta będzie widoczna dla ludzi, prawie bez względu na to, co powiesz na ten temat w poprzednim tekście. Aby nie zostać źle zrozumianym, zawsze pomocne jest sprecyzowanie, jaką odpowiedź oferujesz. (+1 za poprawioną odpowiedź, BTW)
whuber

3
Rzeczywiście, bez względu na wiarę w inżynierów, nie jest bardzo zaskakujące, że jeśli obserwujesz prób bez żadnych awarii, średnio powinieneś spodziewać się awarii w następnych próbach , a zatem powinieneś spodziewać się co najmniej jednej awaria z prawdopodobieństwem , która jest w przybliżeniu dla małego . Tak więc 100 000 udanych prób daje około 10% spodziewanego prawdopodobieństwa co najmniej jednej porażki w ciągu następnych 10 000 prób. k k n 1 - e - k k kn1kkn1ekkk
Ilmari Karonen

2
@ whuber Twoje założenie, że przeor nie ma znaczenia, nie jest prawdziwe w przypadku awarii zerowych. Zależy to w dużej mierze od nachylenia w pobliżu zera, na przykład płaski jednolity przed (beta 1,1) i Jeffreys przed (beta 0,5, 0,5) da zasadniczo inny tył.
Erik

12

Zamiast obliczać prawdopodobieństwo, dlaczego nie przewidzieć, ile produktów może zawieść?

Modelowanie obserwacji

W tej dziedzinie znajduje się produktów, a kolejne . Załóżmy, że ich awarie są niezależne i stałe z prawdopodobieństwem .m = 10000 pn=100000m=10000p

Możemy modelować tę sytuację za pomocą eksperymentu dwumianowego: z pudełka biletów o nieznanej proporcji biletów „awarii” i biletów „sukcesu” narysuj biletów (z wymianą, tak aby prawdopodobieństwo niepowodzenia pozostaje takie samo). Policz niepowodzeń wśród pierwszych biletów - niech to będzie --and liczba niepowodzeń wśród pozostałych biletów, nazywając tę .1 - p m + n = 110000 n X m Yp1pm+n=110000nXmY

Opracowanie pytania

Zasadniczo i może być cokolwiek. To, co jest zainteresowany jest prawdopodobieństwo, że podano , że (z dowolną liczbę w ). Ponieważ awarie mogą wystąpić w dowolnym miejscu spośród wszystkich biletów , przy każdej możliwej konfiguracji mającej tę samą szansę, można je znaleźć, dzieląc liczbę podzbiorów rzeczy przez liczbę podzbiorów wszystkich rzeczy:0 Y m Y = u X + Y = u u { 0 , 1 , , m } n + m u m u n + m0Xn0YmY=u X+Y=uu{0,1,,m}n+mumun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

Porównywalne wzory mogą być użyte do obliczeń, gdyX=1,2,.

Górnej granica przewidywania1α (UPL) do liczby uszkodzeń w tych ostatnich bilety, , obliczana jest najmniejszy (w zależności od ), w którym .mtα(X;n,m)uXp(u;n,m)α

Interpretacja

UPL należy interpretować pod kątem ryzyka użycia , ocenianego przed zaobserwowaniem lub Innymi słowy, przypuśćmy, że to jest rok temu i zostaniesz poproszony o zalecenie procedury przewidywania liczby awarii w następnych produktach po zaobserwowaniu pierwszego . Twój klient pytatαXYmn

Jaka jest szansa, że procedura będzie underpredict ? Nie mam na myśli w przyszłości, kiedy będziesz mieć więcej danych; Mam na myśli w tej chwili, ponieważ muszę teraz podejmować decyzje, a jedyne szanse, jakie będę mieć, to te, które można teraz obliczyć. ”Y

Twoja odpowiedź może być

W tej chwili szansa nie jest większa niż , ale jeśli planujesz użyć mniejszej prognozy, szansa przekroczy .αα

Wyniki

Dla , , a możemy to obliczyćn=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Zatem po zaobserwowaniuX=0 ,

  • Dla pewności do (czyli gdy ), przewiduj, że w następnych produktów wystąpi najwyżej awaria .1α=90.9%9.1%αtα(0;n,m)=110,000

  • Dla pewności (to znaczy, gdy ), przewiduj, że najwyżej awarie w następnych produktów.99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Itp.


Komentarze

Kiedy i dlaczego takie podejście miałoby mieć zastosowanie? Załóżmy, że Twoja firma produkuje wiele różnych produktów. Po zaobserwowaniu wydajności każdego z nich w polu lubi przedstawiać gwarancje, takie jak „całkowita bezpłatna wymiana awarii w ciągu jednego roku”. Dysponując limitami prognoz dla liczby awarii, możesz kontrolować całkowite koszty konieczności zabezpieczenia tych gwarancji. Ponieważ tworzysz wiele produktów i oczekujesz, że niepowodzenia będą spowodowane przypadkowymi okolicznościami, na które nie masz wpływu, doświadczenie każdego produktu będzie niezależne. Na dłuższą metę warto kontrolować ryzykon. Co jakiś czas możesz być zmuszony do zapłaty większej liczby roszczeń niż oczekiwano, ale przez większość czasu zapłacisz mniej. Jeśli płacenie więcej niż zapowiadane może być rujnujące, ustawisz na bardzo małą (i prawdopodobnie użyłbyś również bardziej wyrafinowanego modelu awarii!). W przeciwnym razie, jeśli koszty są niewielkie, możesz żyć z niskim poziomem pewności (wysoka ). Obliczenia te pokazują, jak zrównoważyć zaufanie i ryzyko.αα

Zauważ, że nie musimy obliczać pełnej procedury . Czekamy, aż zostanie zaobserwowany, a następnie po prostu przeprowadzamy obliczenia dla tego konkretnego (tutaj, ), jak pokazano powyżej. Zasadniczo moglibyśmy jednak przeprowadzić obliczenia dla wszystkich możliwych wartości na początku.tXXX=0X

Podejście bayesowskie (opisane w innych odpowiedziach) jest atrakcyjne i będzie dobrze działać, pod warunkiem, że wyniki nie zależą w dużej mierze od wcześniejszych. Niestety, gdy wskaźnik awarii jest tak niski, że obserwuje się bardzo niewiele (lub nie ma awarii), wyniki są wrażliwe na wybór wcześniejszego.


+1, ale nie wydaje się poprawne. p(0,n,m)=1
ameba mówi Przywróć Monikę

1
@COOLSerdash, ponieważ , a warunki dla nie są równe zero. up(u,n,m)=1u=1,2...
ameba mówi Przywróć Monikę

1
Otrzymujesz , jak zauważa @amoeba, dlatego, że twoje nie jest tak naprawdę , ale raczej (i dlatego powinien być naprawdę oznaczony np. Jako lub coś w tym rodzaju). Mam problem z podążeniem za tym, co później z tym zrobisz, ale jestem prawie pewien, że cokolwiek to jest, niestety nie jest to właściwe rozwiązanie problemu, o co pytano. up(u;n,m)>1p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)
Ilmari Karonen

1
@IlmariKaronen Dziękuję za komentarze. Masz rację, że powinienem nieco bardziej scharakteryzować , ponieważ nie jest to rozkład prawdopodobieństwa nad - to prawdopodobieństwo warunkowe - ale uważam, że sama odpowiedź jest jednak poprawna i ja Jestem przekonany, że takie podejście do obliczania limitów prognoz jest zarówno prawidłowe, jak i konwencjonalne. Zedytuję ten post, aby wyjaśnić te kwestie. p(u;n,m)u
whuber

1
@Ilmari Dokonałem już edycji - możesz to zobaczyć w historii edycji. Nie zakładam żadnych priorytetów i do tego problemu stosuję jedynie definicję przedziału predykcji. Jeśli chcesz zakwestionować, czy jest to „statystycznie znaczące”, wtedy będziesz kwestionował ten standardowy konstrukt. Patrz na przykład Hahn & Meeker, Statistics Intervals (J. Wiley 1991).
whuber

9

Poniżej znajduje się odpowiedź bayesowska na „Spośród 10 000 nowych produktów, ile z nich ma się nie powieść, jeśli wszystkie poprzednie 100 000 nie zawiodło?”, Ale należy wziąć pod uwagę wrażliwość na różne priorytety.

Załóżmy, że są warunkowo niezależne i identycznie rozmieszczone, biorąc pod uwagę , tak że , i użyj koniugatu przed , z .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

Dla mamy m<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

Dla mamy w którym użyliśmy .m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Podając swoje liczby, z jednolitym przełożeniem ( ) oczekujesz wskaźnika awaryjności około , podczas gdy przełożony podobny do Jeffreysa ( ) daje ci wskaźnik awaryjności zbliżony do .a=1,b=110%a=1/2,b=1/25%

Oczekiwanie predykcyjne nie wygląda na dobre podsumowanie, ponieważ rozkład predykcyjny jest mocno wypaczony. Możemy pójść dalej i obliczyć rozkład predykcyjny. Ponieważ warunkowanie, jak to zrobiliśmy przed dla .

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

Skończę to później, obliczając przedział predykcyjny .95%


3
+1 za wykazanie, że wynik jest wrażliwy na kształt wcześniejszego bliskiego 0. (Warto zauważyć, że ponieważ funkcja prawdopodobieństwa jest silnie skoncentrowana w pobliżu zera, gdy jest duże, to jedyna część wcześniejszego, która naprawdę ma znaczenie. Dla na przykład dla wcześniej oczekiwanie jest w przybliżeniu proporcjonalne do , ale prawie niezależne od . Podobnie, dla jednolity przeor, nie ma większego znaczenia, czy przeor jest czy , ale sytuacja zmieniłaby się dramatycznie, gdybyśmy przyjęli takie jak .)mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

Stosując podejście Laplace'a do problemu wschodu słońca , otrzymujemy prawdopodobieństwo, że produkt ulegnie awarii w ciągu roku . Następnie prawdopodobieństwo, że nowych produktów nie zawiedzie w ciągu roku, wynosi Dlatego prawdopodobieństwo, że co najmniej jeden produkt zawiedzie w przyszłym roku, wynosi Dla wartość wynosi . W przypadku Whubera , w rzeczywistości dość wysoki.

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Oczywiście powinieneś aktualizować swoje dane, dopóki sprzedawanych jest więcej produktów, w końcu jeden zawiedzie.


Ta odpowiedź wydaje się nieprawidłowa: obliczenia dla jednego przyszłego wschodu słońca nie rozciągają się po prostu przez pomnożenie. W końcu załóżmy, że liczba została zastąpiona przez . Czy twierdziłbyś, że prawdopodobieństwo niepowodzenia to ?? Powinieneś porównać swoją odpowiedź z analizą zawartą w odpowiedzi Yaira Daona i powiązanymi komentarzami. 10,000200,000200000/1000012
whuber

@ whuber, naprawiono
Aksakal

1
(1) Albo przeliczyłeś się, albo twój „200000” to literówka dla „20000”. (Powinieneś uzyskać około .) (2) Twoja analiza odtwarza teraz część wniosków Yaira Daona, ale bez korzyści uzyskania pełnego rozkładu z tyłu. 0.865
whuber

@ whuber, tak, to było o jedno zero zero
Aksakal

5

Na to pytanie udzielono kilku dobrych odpowiedzi, ale ostatnio miałem okazję przejrzeć kilka zasobów na ten temat, dlatego postanowiłem podzielić się wynikami.

Istnieje wiele możliwych estymatorów danych zerowych awarii. Oznaczmy jako liczbę awarii, a jako wielkość próbki. Estymator największego prawdopodobieństwa prawdopodobieństwa awarii, biorąc pod uwagę te dane, wynosik=0n

(1)P(K=k)=kn=0

Takie oszacowanie jest raczej niezadowalające, ponieważ fakt, że nie zaobserwowaliśmy żadnych błędów w naszej próbie, nie dowodzi, że są one ogólnie niemożliwe. Brak wiedzy o danych sugeruje, że istnieje pewne prawdopodobieństwo niepowodzenia, nawet jeśli nie było (jeszcze) zaobserwowane. Posiadanie wiedzy a priori prowadzi nas do stosowania metod bayesowskich omówionych przez Baileya (1997), Razzaghi (2002), Basu i in. (1996) oraz Ludbrook i Lew (2009).

Wśród prostych estymatorów zakłada się „górną granicę” estymatora (Bailey, 1997)

że nie byłoby logiczne, aby estymator P dla przypadku zerowego uszkodzenia dawał prawdopodobieństwo przekraczające prawdopodobieństwo przewidywane przez estymator maksymalnego prawdopodobieństwa w przypadku jednego uszkodzenia, rozsądna górna granica

zdefiniowana jako

(2)1n

można wspomnieć. W recenzjach Ludbrook i Lew (2009) innymi możliwościami są „rządy trzech” (por. Tutaj , Wikipedia lub Eypasch i in., 1995)

(3)3n

lub inne odmiany:

(4)3n+1

„zasada 3.7” według Newcombe i Altman (lub 3.6):

(5)3.7n

„nowa zasada czterech”:

(6)4n+4

ale jak stwierdzili Ludbrook i Lew (2009), „zasada trójki” jest „obok bezużyteczna”, a „zasada 3.6” (i 3.7) „mają poważne ograniczenia - są rażąco niedokładne, jeśli początkowa wielkość próby jest mniejsza niż 50” i nie zalecają one metod (3) - (6), sugerując raczej stosowanie właściwych estymatorów bayesowskich (patrz poniżej).

Wśród estymatorów bayesowskich można wymienić kilka różnych. Pierwszym takim estymatorem zaproponowanym przez Baileya (1997) jest

(7)10.51n

do oszacowania mediany w ramach jednolitego przeora

(8)10.51n+1

lub do oszacowania średniej w ramach tego wcześniejszego

(9)1n+2

jeszcze inne podejście zakładające wykładniczy wzorzec awarii ze stałym współczynnikiem awarii (rozkłady Poissona) daje

(10)1/3n

jeśli stosujemy beta uprzednio z parametrów i można wykorzystać wzór (patrz Razzaghi, 2002):ab

(11)aa+b+n

że pod prowadzi do jednolitego przeora (9). Zakładając, że Jeffreys przed prowadzi doa=b=1a=b=0.5

(12)12(n+1)

Ogólnie zalecane są formuły bayesowskie (7) - (12). Basu i wsp. (1996) zalecają (11) z informacyjnym przeorem, gdy dostępna jest pewna wiedza a priori. Ponieważ nie istnieje jedna najlepsza metoda, sugerowałbym przejrzenie literatury przed analizą, szczególnie gdy jest małe.n


Bailey, RT (1997). Oszacowanie na podstawie danych o zerowej awarii. Analiza ryzyka, 17 , 375–380.

Razzaghi, M. (2002). O oszacowaniu prawdopodobieństwa sukcesu dwumianowego przy zerowym wystąpieniu w próbce. Journal of Modern Applied Statistics Methods, 1 (2), 41.

Ludbrook, J., i Lew, MJ (2009). Oszacowanie ryzyka rzadkich powikłań: czy „zasada trzech” jest wystarczająca? Dziennik chirurgiczny ANZ, 79 (7–8), 565–570.

Eypasch, E., Lefering, R., Kum, CK, i Troidl, H. (1995). Prawdopodobieństwo wystąpienia zdarzeń niepożądanych, które jeszcze nie miały miejsca: przypomnienie statystyczne. BMJ 311 (7005): 619–620.

Basu, AP, Gaylor, DW i Chen, JJ (1996). Szacowanie prawdopodobieństwa wystąpienia nowotworu rzadkiego raka z zerowym występowaniem w próbce. Regulatory Toxicology and Pharmacology, 23 (2), 139-144.


1
Doskonały przegląd tego, co tam jest!
AlefSin

W przypadku komentarzy rozpoczynających się w / „Wśród estymatorów bayesowskich kilka ...”, ogólnie nie jest jasne, czy dany komentarz odnosi się do wzoru powyżej, czy poniżej. Czy możesz to wyjaśnić?
gung - Przywróć Monikę

2

Naprawdę musisz wrócić do projektantów swoich produktów. Jest to podstawowy problem inżynieryjny, a nie obserwacyjny problem statystyczny. Będą mieli pojęcie o prawdopodobieństwie uszkodzenia każdego elementu, a na tym prawdopodobieństwie uszkodzenia netto całego zmontowanego produktu. Mogą zapewnić oczekiwaną liczbę awarii w całym okresie projektowania produktu.

Inżynier budownictwa projektuje most, którego żywotność wynosi 120 lat. Każdy element mostu ma niewielką szansę na awarię. Każde ładowanie ma niewielką szansę na przekroczenie. Aby budowa mostu była ekonomiczna, całkowite zawalenie nastąpiłoby tylko raz na 2400 lat, co jest znacznie dłuższe niż utrzymanie mostu. Nic dziwnego, że most nie zawodzi w roku 1, ani od roku 2 do roku 120. To, że nie zawalił się, mówi ci bardzo niewiele. Jego różne szanse na porażkę z czasem mogą oszacować tylko oryginalni projektanci.


0

Jest to podobne do problemu, z którym się spotkałem, gdy wprowadziliśmy nowy proces produkcyjny w celu wyeliminowania awarii produkcji.

Nowy system nie spowodował awarii, więc ludzie zadawali to samo pytanie: w jaki sposób przewidujemy wskaźnik awarii? W twoim przypadku, ponieważ określiłeś okres, w którym awaria może wystąpić bez obawy, kiedy awaria wystąpi w tym okresie, efekty czasowe zostały usunięte. I po prostu chodzi o to, czy coś zawiodło, czy nie. Z tym zastrzeżeniem - z moją odpowiedzią.

Intuicyjnie wydaje się, że potrzebujemy co najmniej jednego niepowodzenia, aby móc obliczyć wskaźnik awarii. Jednak to założenie zawiera ukryty błąd. Nigdy nie będziemy obliczać wskaźnika awaryjności. To dlatego, że mamy do czynienia z próbką. Dlatego możemy oszacować jedynie zakres prawdopodobnych wskaźników awarii. Sposobem na to jest znalezienie rozkładu dla wskaźnika awaryjności. Rozkład, który wykonuje zadanie w tym przypadku, jest rozkładem Beta, w którym parametrami są: α = n + 1 i β = N - n + 1

Uwaga: N to wielkość próbki, a n to liczba awarii (w twoim przypadku 0)

W twoim scenariuszu rozkład wskaźnika awaryjności pokazano poniżej. wprowadź opis zdjęcia tutaj .

Następnie należy wprowadzić ten rozkład do odpowiedniej dwumianowej formuły prawdopodobieństwa, aby uzyskać rozkład prawdopodobieństwa awarii jednej jednostki (można to zrobić analitycznie lub przy użyciu Monte Carlo). Podejrzewam, że liczby będą bardzo niskie.

Pamiętaj, że ten proces ma zastosowanie bez względu na liczbę awarii w twoim zestawie pięści.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.