ISL의 예에서 신뢰 구간 방법 비교
Tibshirani, James, Hastie의 "통계 학습 소개" 책 은 임금 데이터 에서 다항 로지스틱 회귀도 4에 대한 신뢰 구간의 267 페이지에 예 를 제공합니다 . 책 인용하기 :
우리는 4 차 다항식으로 로지스틱 회귀를 사용하여 이진 이벤트 을 모델링합니다 . $ 250,000을 초과하는 적합 후부 임금 확률은 추정 95 % 신뢰 구간과 함께 파란색으로 표시됩니다.wage>250
다음은 이러한 간격을 구성하는 두 가지 방법과 처음부터 구현하는 방법에 대한 주석을 간략히 요약 한 것입니다.
Wald / Endpoint 변환 간격
- 선형 조합 에 대한 신뢰 구간의 상한 및 하한을 계산합니다 (Wald CI 사용).xTβ
- 끝점 에 단조로운 변환을 적용 하여 확률을 구합니다.F(xTβ)
이후 의 단조 변화 인Pr(xTβ)=F(xTβ)xTβ
[Pr(xTβ)L≤Pr(xTβ)≤Pr(xTβ)U]=[F(xTβ)L≤F(xTβ)≤F(xTβ)U]
구체적으로 이것은 를 계산 한 다음 로짓 변환을 결과에 적용하여 하한과 상한을 얻습니다.βTx±z∗SE(βTx)
[exTβ−z∗SE(xTβ)1+exTβ−z∗SE(xTβ),exTβ+z∗SE(xTβ)1+exTβ+z∗SE(xTβ),]
표준 오차 계산
최대 우도 이론은 의 근사 분산은 다음을 사용 하여 회귀 계수 의 공분산 행렬 를 사용하여 계산할 수 있음을 알려줍니다.xTβΣ
Var(xTβ)=xTΣx
설계 행렬 와 행렬 를 다음 과 같이 정의하십시오.XV
X = ⎡⎣⎢⎢⎢⎢⎢11⋮1x1,1x2,1⋮xn,1……⋱…x1,px2,p⋮xn,p⎤⎦⎥⎥⎥⎥⎥ V = ⎡⎣⎢⎢⎢⎢⎢π^1(1−π^1)0⋮00π^2(1−π^2)⋮0……⋱…00⋮π^n(1−π^n)⎤⎦⎥⎥⎥⎥⎥
여기서 는 번째 관측치에 대한 번째 변수 의 값 이고 는 관측치 대한 예측 확률을 나타냅니다 .xi,jjiπ^ii
공분산 행렬은 다음과 같이 찾을 수 있습니다. 및 표준 오류는Σ=(XTVX)−1SE(xTβ)=Var(xTβ)−−−−−−−−√
예측 확률에 대한 95 % 신뢰 구간은 다음과 같이 표시 될 수 있습니다.
델타 방법 신뢰 구간
이 방법은 함수 의 선형 근사 분산을 계산하고 이를 사용하여 큰 표본 신뢰 구간을 구성하는 것입니다.F
Var[F(xTβ^)]≈∇FT Σ ∇F
여기서 는 기울기이고 는 추정 된 공분산 행렬입니다. 한 차원에서 : ∇Σ
∂F(xβ)∂β=∂F(xβ)∂xβ∂xβ∂β=xf(xβ)
여기서 는 의 미분입니다 . 이것은 다변량 사례에서 일반화됩니다.fF
Var[F(xTβ^)]≈fT xT Σ x f
우리의 경우 F는 미분 값이 로지스틱 함수 ( 표시됨)입니다.π(xTβ)
π′(xTβ)=π(xTβ)(1−π(xTβ))
위에서 계산 된 분산을 사용하여 신뢰 구간을 구성 할 수 있습니다.
C.I.=[Pr(xβ^)−z∗Var[π(xβ^)]−−−−−−−−−√≤Pr(xβ^)+z∗Var[π(xβ^)]−−−−−−−−−√]
다변량 사례에 대한 벡터 형식
C.I.=[π(xTβ^)±z∗(π(xTβ^)(1−π(xTβ^)))TxT Var[β^] x π(xTβ^)(1−π(xTβ^))]−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
- 참고 단일 데이터 포인트 나타내는 설계 행렬의, 즉, 하나의 행xRp+1X
개방 된 결론
확률과 음의 로그 확률에 대한 정규 QQ 그림을 보면 어느 것도 정규 분포가 아님을 알 수 있습니다. 이것이 차이점을 설명 할 수 있습니까?
출처: