통계표에없는 (보간) 값은 어떻게 찾습니까?


19

종종 사람들은 p- 값을 얻기 위해 프로그램을 사용하지만 때로는 어떤 이유로 든 테이블 세트에서 임계 값을 얻어야 할 수도 있습니다.

제한된 수의 유의 수준 및 제한된 자유도를 가진 통계표가 주어지면 다른 유의 수준 또는 자유도 (예 : , 카이-제곱 또는 에프 표) 에서 근사 임계 값을 얻는 방법 ?

즉, 테이블의 값 사이에있는 값을 어떻게 찾습니까?

답변:


26

이 답변은 두 가지 주요 부분으로 구성됩니다. 첫째, 선형 보간법을 사용 하고 두 번째로 더 정확한 보간법을 위해 변환을 사용합니다. 여기에 설명 된 접근 방식은 사용 가능한 테이블이 제한되어있는 경우 수작업 계산에 적합하지만 p- 값을 생성하기 위해 컴퓨터 루틴을 구현하는 경우 대신 사용해야하는 더 나은 접근 방식 (수동으로 지루한 경우)이 있습니다.

z- 검정의 10 % (한 꼬리) 임계 값이 1.28이고 20 % 임계 값이 0.84라는 것을 알고 있다면 15 % 임계 값에 대한 대략적인 추측은-(1.28 + 0.84) 사이의 중간입니다. / 2 = 1.06 (실제 값은 1.0364)이며 12.5 % 값은 10 % 값 (1.28 + 1.06) / 2 = 1.17 (실제 값 1.15+)의 중간에서 추측 할 수 있습니다. 이것은 선형 보간이하는 것과 정확히 같지만 '반쪽 사이'대신 두 값 사이의 일부를 살펴 봅니다.

일 변량 선형 보간

간단한 선형 보간의 경우를 보자.

따라서 우리 는 근사하려는 값 근처에 대략 선형이라고 생각되는 함수 ( 엑스 와 같은)를 가지고 있으며 원하는 값의 양쪽에 함수 값이 있습니다 (예 : 다음과 같이).

엑스와이89.316와이162015.6

우리가 알고 있는 y 의 두 값 은 12 (20-8)입니다. x- 값 (대략적인 y- 값을 원하는 값)이 8 : 4 (16-8 및 20-16)의 비율에서 12의 차이를 어떻게 나누는 지보십시오. 즉, 첫 x 값에서 마지막 까지의 거리의 2/3입니다 . 관계가 선형이면 대응하는 y- 값 범위는 동일한 비율이됩니다.엑스와이엑스와이엑스

선형 보간

그래서 동일로에 대해해야한다(16)-(8)와이169.315.69.3 .168208

그것은 와이169.315.69.3168208

재정렬 :

와이169.3+(15.69.3)168208=13.5

통계표의 예 : 12df에 대해 다음과 같은 임계 값을 갖는 t- 테이블이있는 경우 :

(2-꼬리)α0.013.050.022.680.052.180.101.78

우리는 t가 12 df이고 2- 꼬리 알파가 0.025 인 임계 값을 원합니다. 즉, 해당 테이블의 0.02와 0.05 행 사이를 보간합니다.

α0.022.680.025?0.052.18

" " 의 값은 선형 보간법을 사용하여 근사하려는 t 0.025 값입니다. ( t 0.025으로 나는 실제로?0.0250.025 (A)의 역 CDF 시점 t 12 분포).10.025/212

이전과 같이, 분할의 간격 0.020.05 비율 ( 0.025 - 0.02 )( 0.05 - 0.025 ) (즉, 1 : 5 ) 및 미지 t - 값은 분할한다 t의 범위를 2.682.18 동일한 비율; 동등하게 0.025 가 발생합니다 ( 0.025 0.02 ) / ( 0.05 0.02 ) = 1 /0.0250.020.05(0.0250.02)(0.050.025)1:5tt2.682.180.025 따른 방법의 제 X 알려지지 않도록 - 범위, t - 값이 발생하는 1 / 6 따른 방법의 일 t의 - 범위를.(0.0250.02)/(0.050.02)=1/6xt1/6

또는 동등t0.0252.682.182.680.0250.020.050.02

0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

실제 답변은 ... 근접하는 함수가 그 범위에서 선형에 매우 가깝지 않기 때문에 특히 가깝지 않습니다 ( α = 0.5 일수록).2.56α=0.5

t- 테이블에서 임계 값의 선형 보간

변환을 통한 더 나은 근사

선형 보간을 다른 기능적 형태로 대체 할 수 있습니다. 사실상, 우리는 선형 보간이 더 잘 작동하는 스케일로 변형됩니다. 이 경우 테일에서는 많은 표로 표시된 임계 값이 유의 수준 의 와 거의 선형 입니다. log s 를 취한 후에는 이전과 같이 단순히 선형 보간을 적용합니다. 위 예제에서 시도해 보자.로그로그

α로그(α)0.023.9122.680.0253.6890.0250.052.9962.18

지금

0.0252.682.182.68로그(0.025)로그(0.02)로그(0.05)로그(0.02)=3.6893.9122.9963.912

또는 동등하게

0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

인용 된 숫자 수에 맞습니다. 이것은 우리가 x 스케일을 로그로 변환 할 때 관계가 거의 선형이기 때문입니다.

로그 알파의 선형 보간
실제로, 곡선 (회색)은 직선 (파란색) 위에 깔끔하게 놓여 있습니다.

로짓(α)=로그(α1α)=로그(11α1)α로그

다른 자유도에 대한 보간

에프ν1/ν

120/ν120/ν

에프4,νν=601201/νν=80에프 는 cdf의 역수를 나타냄).

에프4,80,.95에프4,60,.95+1/801/601/1201/60(에프4,120,.95에프4,60,.95)

df의 역 interp

( 여기의 다이어그램과 비교 )


여기에 카이 제곱 테이블 조각이 있습니다.

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

57 자유도에 대한 5 % 임계 값 (95 번째 백분위 수)을 찾고 싶다고 상상해보십시오.

자세히 살펴보면 테이블의 5 % 임계 값이 거의 선형으로 진행되는 것을 볼 수 있습니다.

여기에 이미지 설명을 입력하십시오

(녹색 선은 50 및 60 df의 값을 결합하며 40 및 70의 점에 닿는 것을 볼 수 있습니다)

따라서 선형 보간이 잘 수행됩니다. 그러나 물론 그래프를 그릴 시간이 없습니다. 선형 보간을 사용할시기와 더 복잡한 것을 시도 할시기를 결정하는 방법은 무엇입니까?

(엑스50,0.95+엑스70,0.95)/2엑스60,0.95 ?

(67.505+90.531)/2=79.018

엑스67.50579.08267.50557506050 또는

엑스67.505+(79.08267.505)5750605075.61.

실제 값은 75.62375이므로 실제로 3 자리의 정확도를 얻었으며 4 번째 수치에서는 ​​1만큼만 나갔습니다.

유한 한 차이 방법 (특히, 나누는 차이를 통해)을 사용하면보다 정확한 보간이 여전히 이루어질 수 있지만, 이는 대부분의 가설 검정 문제에 대해 과잉 일 수 있습니다.

자유도가 테이블의 끝을지나 가면 이 질문 에 그 문제가 설명되어 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.