로지스틱 회귀 및 순서 독립 변수


10

이 게시물을 찾았습니다.

예. 이 계수는 서수 예측 변수의 각 증가 증분에 대한 로그 확률의 변화를 반영합니다. 이 (매우 일반적인) 모형 규격은 예측 변수가 증분에 선형 영향을 미친다고 가정합니다. 가정을 테스트하기 위해 서수 변수를 단일 예측 변수로 사용하는 모델과 반응을 이산하여 여러 예측 변수로 취급하는 모델을 비교할 수 있습니다 (변수가 명목 인 것처럼). 후자의 모델이 훨씬 더 적합하지 않은 경우 선형 효과를 갖는 것으로 각 증분을 처리하는 것이 합리적입니다.

@ dmk38 12 월 12 일 10시 5 분 21 초

이 주장을 뒷받침하는 출판물을 어디서 찾을 수 있는지 말씀해 주시겠습니까? 데이터로 작업하고 있으며 로지스틱 회귀 분석에서 순서 독립 변수를 사용하고 싶습니다.


비슷한 질문을 참조하십시오 stats.stackexchange.com/q/195246/3277
ttnphns

답변:


2

@Scortchi가 지적 했듯이 직교 다항식을 사용할 수도 있습니다. 다음은 R의 간단한 데모입니다.

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...

8

로지스틱 회귀 분석에 대한 좋은 책은 아마도 그 단어로 정확하게는 아니지만 이것을 가지고있을 것입니다. 매우 권위있는 출처에 대해서는 Agresti의 범주 형 데이터 분석을 사용해보십시오.

또한 로지스틱 회귀 (또는 로지스틱 회귀)의 정의를 따릅니다. 순서 독립 변수에 대해 명시 적으로 몇 가지 방법이 있습니다 . 일반적인 옵션은 범주 형 (순서를 잃는) 또는 연속 형 (인용 한 인용문에 가정을 함)으로 처리하는 것입니다. 그것을 연속으로 취급하면 분석을 수행하는 프로그램은 서수인지 알 수 없습니다. 예를 들어, IV가 "오바마 대통령을 얼마나 좋아합니까?"라고 가정합니다. 귀하의 답변 선택은 1. "매우"에서 5. "아무것도"의 리 커트 척도입니다. 이것을 프로그램의 관점에서 연속적인 것으로 간주하면 "5"답변은 "1"답변의 5 배입니다. 이것은 합리적이지 않을 수도 있습니다.


3
섹션 5.4.6. 또한 직교 다항식을 사용하여 아이디어를 확장하여 순서 예측자를 코딩 할 수 있습니다.
Scortchi-Monica Monica 복원

귀하의 의견에 감사드립니다, 그들은 내 분석에 많은 도움이 될 것입니다.
Frederico

2
@Frederico, Peter의 답변으로 질문을 해결 한 경우 왼쪽의 투표 총계 아래에있는 확인 표시를 클릭하여 수락해야합니다.
gung-Monica Monica 복원
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.