그것은 나에게 충격의 비트로의 평균 것을 나는 정규 분포 몬테카를로 시뮬레이션을했고, 발견 처음 온 에서 표준 편차 샘플, 모든 단지의 샘플 크기를 갖는 훨씬 적은 것으로 판명를, 즉, 모집단을 생성하는 데 사용되는 평균 회보다 . 그러나 이것은 거의 기억 나지 않는다면 잘 알려져 있으며, 내가 알거나 시뮬레이션을하지 않았을 것입니다. 시뮬레이션은 다음과 같습니다.
다음은 100, , 및 사용하여 의 95 % 신뢰 구간을 예측하는 예입니다. .
RAND() RAND() Calc Calc
N(0,1) N(0,1) SD E(s)
-1.1171 -0.0627 0.7455 0.9344
1.7278 -0.8016 1.7886 2.2417
1.3705 -1.3710 1.9385 2.4295
1.5648 -0.7156 1.6125 2.0209
1.2379 0.4896 0.5291 0.6632
-1.8354 1.0531 2.0425 2.5599
1.0320 -0.3531 0.9794 1.2275
1.2021 -0.3631 1.1067 1.3871
1.3201 -1.1058 1.7154 2.1499
-0.4946 -1.1428 0.4583 0.5744
0.9504 -1.0300 1.4003 1.7551
-1.6001 0.5811 1.5423 1.9330
-0.5153 0.8008 0.9306 1.1663
-0.7106 -0.5577 0.1081 0.1354
0.1864 0.2581 0.0507 0.0635
-0.8702 -0.1520 0.5078 0.6365
-0.3862 0.4528 0.5933 0.7436
-0.8531 0.1371 0.7002 0.8775
-0.8786 0.2086 0.7687 0.9635
0.6431 0.7323 0.0631 0.0791
1.0368 0.3354 0.4959 0.6216
-1.0619 -1.2663 0.1445 0.1811
0.0600 -0.2569 0.2241 0.2808
-0.6840 -0.4787 0.1452 0.1820
0.2507 0.6593 0.2889 0.3620
0.1328 -0.1339 0.1886 0.2364
-0.2118 -0.0100 0.1427 0.1788
-0.7496 -1.1437 0.2786 0.3492
0.9017 0.0022 0.6361 0.7972
0.5560 0.8943 0.2393 0.2999
-0.1483 -1.1324 0.6959 0.8721
-1.3194 -0.3915 0.6562 0.8224
-0.8098 -2.0478 0.8754 1.0971
-0.3052 -1.1937 0.6282 0.7873
0.5170 -0.6323 0.8127 1.0186
0.6333 -1.3720 1.4180 1.7772
-1.5503 0.7194 1.6049 2.0115
1.8986 -0.7427 1.8677 2.3408
2.3656 -0.3820 1.9428 2.4350
-1.4987 0.4368 1.3686 1.7153
-0.5064 1.3950 1.3444 1.6850
1.2508 0.6081 0.4545 0.5696
-0.1696 -0.5459 0.2661 0.3335
-0.3834 -0.8872 0.3562 0.4465
0.0300 -0.8531 0.6244 0.7826
0.4210 0.3356 0.0604 0.0757
0.0165 2.0690 1.4514 1.8190
-0.2689 1.5595 1.2929 1.6204
1.3385 0.5087 0.5868 0.7354
1.1067 0.3987 0.5006 0.6275
2.0015 -0.6360 1.8650 2.3374
-0.4504 0.6166 0.7545 0.9456
0.3197 -0.6227 0.6664 0.8352
-1.2794 -0.9927 0.2027 0.2541
1.6603 -0.0543 1.2124 1.5195
0.9649 -1.2625 1.5750 1.9739
-0.3380 -0.2459 0.0652 0.0817
-0.8612 2.1456 2.1261 2.6647
0.4976 -1.0538 1.0970 1.3749
-0.2007 -1.3870 0.8388 1.0513
-0.9597 0.6327 1.1260 1.4112
-2.6118 -0.1505 1.7404 2.1813
0.7155 -0.1909 0.6409 0.8033
0.0548 -0.2159 0.1914 0.2399
-0.2775 0.4864 0.5402 0.6770
-1.2364 -0.0736 0.8222 1.0305
-0.8868 -0.6960 0.1349 0.1691
1.2804 -0.2276 1.0664 1.3365
0.5560 -0.9552 1.0686 1.3393
0.4643 -0.6173 0.7648 0.9585
0.4884 -0.6474 0.8031 1.0066
1.3860 0.5479 0.5926 0.7427
-0.9313 0.5375 1.0386 1.3018
-0.3466 -0.3809 0.0243 0.0304
0.7211 -0.1546 0.6192 0.7760
-1.4551 -0.1350 0.9334 1.1699
0.0673 0.4291 0.2559 0.3207
0.3190 -0.1510 0.3323 0.4165
-1.6514 -0.3824 0.8973 1.1246
-1.0128 -1.5745 0.3972 0.4978
-1.2337 -0.7164 0.3658 0.4585
-1.7677 -1.9776 0.1484 0.1860
-0.9519 -0.1155 0.5914 0.7412
1.1165 -0.6071 1.2188 1.5275
-1.7772 0.7592 1.7935 2.2478
0.1343 -0.0458 0.1273 0.1596
0.2270 0.9698 0.5253 0.6583
-0.1697 -0.5589 0.2752 0.3450
2.1011 0.2483 1.3101 1.6420
-0.0374 0.2988 0.2377 0.2980
-0.4209 0.5742 0.7037 0.8819
1.6728 -0.2046 1.3275 1.6638
1.4985 -1.6225 2.2069 2.7659
0.5342 -0.5074 0.7365 0.9231
0.7119 0.8128 0.0713 0.0894
1.0165 -1.2300 1.5885 1.9909
-0.2646 -0.5301 0.1878 0.2353
-1.1488 -0.2888 0.6081 0.7621
-0.4225 0.8703 0.9141 1.1457
0.7990 -1.1515 1.3792 1.7286
0.0344 -0.1892 0.8188 1.0263 mean E(.)
SD pred E(s) pred
-1.9600 -1.9600 -1.6049 -2.0114 2.5% theor, est
1.9600 1.9600 1.6049 2.0114 97.5% theor, est
0.3551 -0.0515 2.5% err
-0.3551 0.0515 97.5% err
총계를 보려면 슬라이더를 아래로 끕니다. 이제 일반 SD 추정기를 사용하여 평균 0 주위의 95 % 신뢰 구간을 계산했으며 0.3551 표준 편차 단위로 해제되었습니다. E (s) 추정기는 0.0515 표준 편차 단위 만 꺼집니다. 표준 편차, 평균의 표준 오차 또는 t- 통계량을 추정하면 문제가있을 수 있습니다.
내 추론은 다음과 같습니다. 두 값 의 모집단 평균 는 과 관련하여 어디든지있을 수 있으며 에 위치하지 않습니다. 후자는 절대적으로 가능한 최소 합계를 만듭니다. 다음과 같이 과소 평가하기 위해 제곱x 1 x 1 + x 2 σ
wlog let 이면 는 , 가능한 최소 결과.Σ n i = 1 ( x i − ˉ x ) 2 2 ( d
즉 표준 편차는 다음과 같이 계산됩니다.
,
모집단 표준 편차 ( ) 의 바이어스 추정량입니다 . 이 공식에서 우리는 의 자유도를 1 씩 줄이고 나눕니다 . 즉, 우리는 약간의 수정을 수행하지만, 단지 무정형이며 가 더 나은 경험 법칙입니다 . 우리 들어 일례 화학식 우리에게 제공 할 같은 통계적 타당 최소값 보다 바람직한 기대 값 ( )은n n − 1 n − 3 / 2 x 2 − x 1 = d SD S D = dμ≠ˉxsE(s)=√n<10SDσn25n<25n=1000. 일반적인 계산의 경우, , 는 이 약 때 의 1 % 과소 평가에만 접근하는 작은 수 바이어스 라고하는 매우 과소 평가되어 있습니다. 많은 생물학적 실험에서 가 있기 때문에 이것은 실제로 문제입니다. 내용 , 오차는 대략 10에서 25 중량 부이다. 일반적으로 소수 바이어스 보정 은 정규 분포의 모집단 표준 편차에 대한 편견 추정기가 다음과 같다는 것을 의미합니다.
에서 위키 백과 를 크리에이티브 커먼즈 라이센스에 따라하는 것은의 SD의 과소 평가의 플롯이있다
SD는 모집단 표준 편차의 편향 추정기 이므로 로 MVUE라고 말하지 않는 한, 모집단 표준 편차 의 최소 분산 편향 추정량 MVUE 가 될 수 없습니다.
비 - 정규 분포에 관하여 대략 바이어스 판독 이 .
이제 질문 Q1 이 온다
위의 가 샘플 크기 의 정규 분포의 에 대한 MVUE 임을 증명할 수 있습니까 ? 여기서 은 1보다 큰 양의 정수입니다.σ N N
힌트 : (답은 아닙니다) 정규 분포에서 표본 표준 편차의 표준 편차를 어떻게 찾을 수 있습니까?를 참조하십시오. .
다음 질문, Q2
어쨌든 사용하는 이유가 무엇인지 설명해 주시겠습니까 ? 즉, 대부분의 모든 것에 사용하지 않는 이유는 무엇입니까? E ( 초 )보충적으로, 아래 답변에서 분산이 편향되지 않았지만 제곱근이 치우친다는 것이 분명해졌습니다. 나는 편향되지 않은 표준 편차가 사용되어야 할 때의 문제에 대한 답변을 요구할 것이다.
결과적으로, 위의 시뮬레이션에서 편견을 피하기 위해 분산은 SD 값이 아닌 평균화되었을 수 있습니다. 이 효과를 확인하기 위해 위의 SD 열을 제곱하고 그 값을 평균하면 0.9994를 얻습니다. 제곱근은 표준 편차 0.9996915의 추정치이며 오류는 2.5 % 꼬리에 대해 0.0006입니다. 95 % 꼬리의 경우 -0.0006 분산은 부가 적이므로 평균화는 오류 절차가 낮습니다. 그러나 표준 편차는 치우 치며 분산을 중개자로 사용하는 사치가없는 경우에도 여전히 작은 수의 수정이 필요합니다. 분산을 중개자로 사용할 수 있지만이 경우, 작은 표본 수정은 편차가없는 표준 편차 0.9996915의 제곱근에 1.002528401을 곱하여 1.002219148을 편차가없는 표준 편차 추정치로 제안합니다. 따라서 작은 숫자 수정을 사용하여 지연시킬 수는 있지만 완전히 무시해야합니까?
여기서 문제는 사용을 무시하는 대신 작은 숫자 수정을 사용해야 할 때이며, 주로 사용을 피했습니다.
또 다른 예는 오류가있는 선형 추세를 설정하기위한 공간의 최소 포인트 수는 3입니다. 이 점들을 보통 최소 제곱으로 맞추면 비선형 성이 있으면 접힌 법선 잔차 패턴이되고 선형성이 있으면 절반 법선이됩니다. 일반적으로 절반의 경우 분포 평균은 적은 수의 수정이 필요합니다. 우리가 4 개 이상의 포인트로 같은 트릭을 시도하면, 분포는 일반적으로 관련이 없거나 특성화하기 쉽지 않습니다. 분산을 사용하여 어떻게 3 점 결과를 결합 할 수 있습니까? 아마도 아닐 수도 있습니다. 그러나 거리와 벡터 측면에서 문제를 파악하는 것이 더 쉽습니다.