청크 테스트 란 무엇입니까?


13

에 대한 질문에 대한 대답에서 다중 공선의 존재 모델 선택 , 프랭크 하렐은 제안 :

모든 변수를 모형에 넣지 만 경쟁 변수의 효과에 대해 조정 된 하나의 변수의 효과에 대해서는 테스트하지 않습니다 ... 경쟁 변수의 청크 테스트는 공선 변수가 전체 다중 자유도 연관 검정 대신 힘을 결합하기 때문에 강력합니다. 변수를 개별적으로 테스트 할 때처럼 서로 경쟁합니다.

청크 테스트 란 무엇입니까 ? 당신은 그들의 응용 프로그램의 예를 들어 줄 수 있습니까 r?


3
이것이 한 번에 변수 블록을 테스트하는 것을 의미한다고 생각합니다. 모든 잠재적 공선 성이 블록 내에서 발생하는데, 검정 또는 우도 비율 검정과 같은 옴니버스 검정에는 영향을 미치지 않지만 " 청크 테스트 ". F
매크로

2
내가 제안한 (그리고 직접 수행 한) 상황 중 하나는 상호 배타적 인 더미 변수 (예 : 잠재적 범주가 많은 공칭 독립 변수)가있는 경우입니다. 단일 더미 변수와 관련된 개별 계수의 테스트는 기준선으로 선택한 것과의 대비를 테스트하기 때문에 그리 흥미롭지 않습니다. 따라서보다 유익한 테스트는 모든 더미 변수를 생략 한 제한된 모델의 우도 비 테스트입니다.
Andy W

2
@FrankHarrell 페이징 ...
fmark

작동하지 않습니다. fmark. :)
추기경

1
부끄러운 일 :)
fmark

답변:


13

@ mark999는 훌륭한 답변을 제공했습니다. 다항식 항을 함께 테스트하는 것 외에도 모든 변수 세트를 함께 테스트 ( "청크 테스트") 할 수 있습니다. 경쟁 공선 변수 인 삼두근 둘레, 허리, 엉덩이 둘레, 모든 신체 크기 측정 모델이 있다고 가정합니다. 전체 신체 크기 청크 테스트를 받으려면 다음을 수행하십시오.

require(rms)
f <- ols(y ~ age + tricep + waist + pol(hip,2))
anova(f, tricep, waist, hip)  # 4 d.f. test

NAtricep, waist, hipR2


1
프랭크를 지적 해 주셔서 감사합니다. 네가 할 수있는 줄 몰랐어
mark999

12

Andy와 마찬가지로 Macro의 의견도 정확합니다. 다음은 예입니다.

> library(rms)
> 
> set.seed(1)
> d <- data.frame(x1 = rnorm(50), x2 = rnorm(50))
> d <- within(d, y <- 1 + 2*x1 + 0.3*x2 + 0.2*x2^2 + rnorm(50))
> 
> ols1 <- ols(y ~ x1 + pol(x2, 2), data=d) # pol(x2, 2) means include x2 and x2^2 terms
> ols1

Linear Regression Model

ols(formula = y ~ x1 + pol(x2, 2), data = d)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       50    LR chi2     79.86    R2       0.798    
sigma 0.9278    d.f.            3    R2 adj   0.784    
d.f.      46    Pr(> chi2) 0.0000    g        1.962    

Residuals

    Min      1Q  Median      3Q     Max 
-1.7463 -0.4789 -0.1221  0.4465  2.2054 

          Coef   S.E.   t     Pr(>|t|)
Intercept 0.8238 0.1654  4.98 <0.0001 
x1        2.0214 0.1633 12.38 <0.0001 
x2        0.2915 0.1500  1.94 0.0581  
x2^2      0.2242 0.1163  1.93 0.0602  


> anova(ols1)
                Analysis of Variance          Response: y 

 Factor     d.f. Partial SS MS          F      P     
 x1          1   131.894215 131.8942148 153.20 <.0001
 x2          2    10.900163   5.4500816   6.33 0.0037
  Nonlinear  1     3.196552   3.1965524   3.71 0.0602
 REGRESSION  3   156.011447  52.0038157  60.41 <.0001
 ERROR      46    39.601647   0.8609054              

"청크 검정"은 항 x2x2^2항을 따로 고려하는 대신 , 항의 계수가 모두 0이라는 귀무 가설을 테스트하는 2-df 검정입니다 (저는 일반적으로 "일반 선형 F 검정"이라고합니다 ). 해당 검정의 p- 값은로 주어진 0.0037 anova(ols1)입니다.

에 있습니다 rms패키지, 당신은 지정해야합니다 x2으로 조건을 pol(x2, 2)위한 anova.rms()그들이 함께 시험을하여야한다 알고.

anova.rms()예를 들어, rcs(x2, 3)범주 형 예측 변수를 사용하여 제한된 입방 스플라인으로 표시되는 예측 변수에 대해 유사한 테스트를 수행 합니다. 또한 "청크"에 상호 작용 용어가 포함됩니다.

인용에서 언급 한 것처럼 일반적인 "경쟁"예측 변수에 대해 청크 테스트를 수행하려면 두 모델을 개별적으로 피팅 한 다음을 사용하여 수동으로 수행해야한다고 생각합니다 anova(model1, model2). [편집 : 이것은 잘못되었습니다. Frank Harrell의 답변을 참조하십시오.]


2
Xcor(X,X2)=0

명확성을 기하기 위해, 나는 이것이 공동 중요도에 대해 2 개 이상의 변수를 테스트하는 "부분 F- 검정"으로 배운 것으로 생각합니다. 또는 모형의 변수 하위 집합이 우도 비율 검정과 같이 더 제한된 모형보다 개선되는지 여부입니다. 제가 맞습니까?
C. Pieters

@ C.Pieters 나는 당신이 옳은지는 모르겠지만 합리적인 것처럼 들립니다.
mark999
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.