내가 가진 몇 가지 생각 :
이것은 두 표본 t- 검정을 수행하는 것과 유사합니다. 두 번째 표본의 경우 단일 값만 있고 30 개의 값이 반드시 정규 분포를 따르는 것은 아닙니다.
옳은. 아이디어는 단일 값을 가진 t- 테스트와 조금 비슷합니다. 분포를 알 수 없으며 30 개의 데이터 포인트 만있는 정규성은 삼키기가 다소 어려울 수 있으므로 일종의 비모수 적 테스트가 필요합니다.
30 회 측정 대신 10000 회 측정을 수행 한 경우 단일 측정의 순위가 유용한 정보를 제공 할 수 있습니다.
30 회 측정하더라도 순위가 유익 할 수 있습니다.
@ whuber가 지적했듯이 일종의 예측 간격을 원합니다. 비모수 적 사례의 경우 본질적으로 묻는 것은 다음과 같습니다. 주어진 데이터 포인트가 우연히 31 번째 측정에서 관찰 한 순위를 가질 확률 은 얼마입니까?
이는 간단한 순열 테스트를 통해 해결할 수 있습니다. 다음은 15 개의 값을 가진 예제와 실제로 이전의 것보다 큰 소설 (16 번째 관측 값)입니다.
932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647
new value: 1374
우리는 N 순열을 수행 하여 목록의 요소 순서가 섞인 다음 질문을합니다. (셔플 된) 목록의 첫 번째 요소 값의 순위는 무엇입니까?
N = 1,000 순열을 수행하면 목록에서 첫 번째 요소의 순위가 새 값의 순위와 같거나 더 나은 608 개의 경우가 생깁니다 (새 값이 가장 좋으므로 실제로 동일 함). 1,000 개의 순열에 대해 시뮬레이션을 다시 실행하면 658 건, 663 건이됩니다.
N = 1,000,000 순열을 수행하면 목록에서 첫 번째 요소의 순위가 새 값의 순위와 같거나 더 나은 62825 건을 얻습니다 (추가 시뮬레이션은 62871 건, 62840 건). 조건이 만족되는 경우와 전체 순열 수 사이의 비율을 취하면 0.062825, 0.062871, 0.06284 ...
이 값들이 1 / 16 = 0.0625 (6.25 %)로 수렴하는 것을 볼 수 있습니다. @whuber가 지적한 것처럼 임의의 값으로 주어진 주어진 값 (16 개 중)이 그 중에서 가장 높은 순위를 가질 확률입니다.
새 값이 두 번째로 높은 값인 새 데이터 집합의 경우 (예 : 순위 2) :
6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594
new value: 8202
우리는 (N = 1,000,000 순열의 경우) : 125235, 124883을 얻습니다. 다시, 무작위로 그려진 주어진 값 (16 중)이 두 번째로 가능한 가장 높은 순위를 가질 확률과 비슷합니다 : 2 / 16 = 0.125 (12.5 %).