범주 형 변수 만있는 회귀


24

모든 종속 변수와 독립 변수가 범주 형 변수 인 경우 회귀를 수행 할 수 있습니까?


3
반응 (종속) 변수가 순수하게 숫자로 처리되는 한 일반적인 회귀 또는 정원 회귀 분석에서도 가능합니다. 소프트웨어에 따라이를 발생 시키거나 강요해야 할 수도 있습니다. 로지스틱 또는 순서 형 회귀 분석을 포함하여 회귀 정의를 적절하게 정의하면 가능할뿐만 아니라 일반적입니다.
닉 콕스

답변:


31

우리는 여기에 우리의 용어를 분명히해야하지만 일반적으로 그렇습니다 .

  • 종속 변수가 연속적이고 잔차 가 정규 분포를 따르지만 ( 여기 참조 ) 독립 변수가 모두 범주 형인 경우 이는 분산 분석에 불과합니다 .
  • 종속 변수가 범주 형이고 독립 변수가 연속적이면 이는 로지스틱 회귀입니다 (이진, 순서 또는 다항식 에 따라 다름).
  • 종속 변수와 독립 변수가 범주 형 변수 인 경우에도 로지스틱 회귀 분석을 사용할 수 있습니다. 이는 일종의 분산 분석 버전의 LR입니다.

로지스틱 회귀 및 일반 최소 제곱 (선형) 회귀 모두 일반 선형 모형 의 특수한 경우입니다 .


언급 한 세 번째 경우입니다. LR을 시도했지만 아무런 계수도 중요하지 않습니다. 나는 내가 잘못하고 있다고 생각했다.
이타 주의자

2
ANOVA 에는 정규 분포 잔차 가 필요한 것보다 더 많은 연속 종속 변수 가 필요 하다고 생각하지 않습니다 . 이것은 분산 분석이 잘 작동하는 조건 일뿐입니다.
Nick Cox

1
@NickCox는 물론입니다. 우리는 이러한 용어를 정의하고 적용하는 방법에 대해 고민하고 있습니다. 내가 넣을 방법은 모델이 이러한 가정에서 파생 된 것이지만 결과가 도움이 될지 여부에 대한 질문으로 충족되지 않더라도 분산 분석을 사용할 수 있습니다.
gung-Monica Monica 복원

1
@altruist, 나는 개념적 명확성을 위해 세 가지 경우를 제시했다. 나는 당신이 원하는 것이 마지막임을 알고 있습니다. 모델을 맞추기 위해 소프트웨어를 올바르게 사용하는지 여부와 계수가 '유의한지'여부는 LR이 상황에 적합한 모델인지 여부와 관련이 없습니다.
gung-Monica Monica 복원

4
범주화되는 것은 때때로 소프트웨어의 정의의 문제이며 때로는 보는 사람의 마음에 달려 있습니다. 예를 들어 아이들의 수는 얼마입니까?
Nick Cox
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.