Kilka myśli, które miałem:
Jest to podobne do chęci przeprowadzenia dwupróbkowego testu t - z wyjątkiem tego, że dla drugiej próbki mam tylko jedną wartość, a 30 wartości niekoniecznie są normalnie rozłożone.
Poprawny. Pomysł przypomina trochę test t z jedną wartością. Ponieważ rozkład nie jest znany, a normalność z jedynie 30 punktami danych może być nieco trudna do przełknięcia, wymaga to pewnego rodzaju testu nieparametrycznego.
Jeśli zamiast 30 pomiarów miałem 10000 pomiarów, ranga pojedynczego pomiaru może dostarczyć użytecznych informacji.
Nawet przy 30 pomiarach ranga może być informacyjna.
Jak zauważył @whuber, potrzebujesz pewnego rodzaju przedziału predykcji. W przypadku nieparametrycznym pytasz zasadniczo: jakie jest prawdopodobieństwo, że dany punkt danych miałby przypadkowo rangę, którą obserwujemy dla twojego 31. pomiaru?
Można temu zaradzić za pomocą prostego testu permutacji. Oto przykład z 15 wartościami i powieścią (szesnasta obserwacja), która jest faktycznie większa niż dowolna z poprzednich:
932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647
new value: 1374
Wykonujemy N permutacji, w których kolejność elementów na liście jest tasowana, a następnie zadajemy pytanie: jaka jest pozycja wartości pierwszego elementu na liście (tasowanej)?
Wykonanie N = 1000 permutacji daje nam 608 przypadków, w których ranga pierwszego elementu na liście jest równa lub lepsza do rangi nowej wartości (w rzeczywistości równej, ponieważ nowa wartość jest najlepsza). Ponownie uruchamiając symulację dla 1000 permutacji, otrzymujemy 658 takich przypadków, a następnie 663 ...
Jeśli wykonamy N = 1 000 000 permutacji, otrzymamy 62825 przypadków, w których ranga pierwszego elementu na liście jest równa lub lepsza od rangi nowej wartości (dalsze symulacje dają 62871 przypadków, a następnie 62840 ...). Jeśli weźmiemy stosunek między przypadkami, w których warunek jest spełniony, a całkowitą liczbą permutacji, otrzymamy liczby takie jak 0,062825, 0,062871, 0,06284 ...
Widać, że wartości te zbiegają się w kierunku 1/16 = 0,0625 (6,25%), co, jak zauważa @whuber, jest prawdopodobieństwem, że dana wartość (z 16) losowana ma najlepszą możliwą rangę wśród nich.
W przypadku nowego zestawu danych, w którym nowa wartość jest drugą najlepszą wartością (tj. Ranga 2):
6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594
new value: 8202
otrzymujemy (dla N = 1 000 000 permutacji): 125235, 124883 ... korzystne przypadki, które ponownie przybliżają prawdopodobieństwo, że dana wartość (z 16) losowana ma drugą z możliwych rangę: 2/16 = 0,125 (12,5%).