이항 결과 및 예측 변수와 함께 로지스틱 회귀를 사용하는 것이 합리적입니까?


18

이진 결과 변수 {0,1} 및 예측 변수 {0,1}이 있습니다. 내 생각은 다른 변수를 포함시키고 승산 비를 계산하지 않으면 물류를하는 것이 의미가 없다는 것입니다.

하나의 이진 예측 변수를 사용하면 확률 충분 확률 대 승산 비를 계산하지 않습니까?

답변:


26

이 경우 데이터를 축소 할 수 있습니다. 여기서 대한 인스턴스의 개수 및 함께 . 전체적으로 관측치 가 있다고 가정합니다 . (S)I, J, X=I, Y=J를I,J{0,1}N

XY010S00S011S10S11
Sijx=iy=ji,j{0,1}n

우리의 모델에 맞는 경우 (여기서, g는 우리 링크 기능이다) 우리 ' 찾을 것이다 \ 모자 \ beta_0이 때 성공 비율의 로짓이다 x_i로부터 = 0\ 모자 \ beta_0 + \ 모자 \ beta_1이 성공 비율의 로짓이다 x_i로부터 = 1 . 즉, \ hat \ beta_0 = g \ left (\ frac {S_ {01}} {S_ {00} + S_ {01}} \ right) \ hat \ beta_0 + \ hat \ beta_1 = g \ left ( \ frac {S_ {11}} {S_ {10} + S_ {11}} \ 오른쪽). g β 0 X = 0 β 0 + β 1 X = 1 β 0 = g ( S 01pi=g1(xiTβ)=g1(β0+β11xi=1)gβ^0xi=0β^0+β^1xi=1 β 0+ β 1=g(S11

β^0=(에스01에스00+에스01)
β^0+β^1=(에스11에스10+에스11).

이인지 확인합시다 R.

n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)

tbl <- table(x=x,y=y)

mod <- glm(y ~ x, family=binomial())

# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])

# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])

로지스틱 회귀 계수는 표에서 나오는 비율을 정확하게 변환 한 것입니다.

결론은 일련의 Bernoulli 랜덤 변수에서 온 데이터가있는 경우 로지스틱 회귀로이 데이터 세트를 분석 할 수 있지만 결과 우연성 테이블을 직접 분석하는 것과 다르지 않은 것으로 판명되었습니다.


왜 이것이 이론적 인 관점에서 작동하는지에 대해 언급하고 싶습니다. 로지스틱 회귀 분석을 적용 할 때 우리는 . 그런 다음 평균을 또는 기호 에서 선형 예측 변수의 변환으로 모델링하기로 결정 . 우리의 경우 우리는 두 가지 고유 한 값이 , 따라서 만이 고유 한 값이있는 , 말의 와 . 우리의 독립 가정의 우리가 가지고 있기 때문에 과 와이나는|엑스나는베른(나는)엑스나는나는=1(β0+β1엑스나는)엑스나는나는01

나는:엑스나는=0와이나는=에스01큰 상자(0,0)
나는:엑스나는=1와이나는=에스11큰 상자(1,1).
와 과 이 무작위가 사실을 어떻게 사용하는지 주목하십시오. 이것이 사실 이 아니라면 반드시 이항 일 필요는 없습니다.엑스나는01

이는

에스01/0=에스01에스00+에스010 과 에스11/1=에스11에스10+에스111.

주요 통찰력 : Bernoulli RV는이항 RV가 인 반면 이지만 둘 다 성공 확률은 같습니다. 이것이 이러한 우발성 테이블 비율이 관측 수준의 로지스틱 회귀와 같은 것을 추정하는 이유입니다. 이는 표와의 일치 일뿐 아니라 우리가 만든 분포 가정의 직접적인 결과입니다.와이나는|엑스나는=제이베른(제이)에스제이1큰 상자(제이,제이)


1

예측 변수가 두 개 이상이고 모든 예측 변수가 이진 변수 인 경우 논리 회귀 [1]를 사용하여 모형을 적합시킬 수 있습니다 ( "논리"가 아니라 "논리"임). 예측 변수 간의 상호 작용 효과가 현저하다고 생각할 때 유용합니다. R ( LogicRegpackage) 에는 구현이 있습니다 .

Ruczinski, I., Kooperberg, C. & LeBlanc, M. (2003). 논리 회귀. 전산 및 그래픽 통계 저널, 12 (3), 475-511.


1
질문은 구체적으로 회귀 자 에 대한 것이므로 귀하의 답변은 주석으로 사용하는 것이 좋습니다.
Richard Hardy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.