회귀 모델에서 변수를 사용하기 전에 연속 변수를 플로팅하고 선형성을 확인해야한다고 생각합니다. 선형성이 합리적인 가정처럼 보인다면, 이것이 대부분의 경우 최종 다 변수 회귀 모델에서 계속 유지 될 것이라고 생각합니다. 그렇지 않은 경우, 이는 주로 수정할 수있는 교호 작용 효과로 인해 발생할 수 있다고 생각합니다.
예, 비선형 연속 변수를 분류하는 것이 하나의 옵션입니다. 이것의 문제점은 대부분의 경우 카테고리가 임의의 것처럼 보일 수 있고 카테고리 간 컷오프 점수의 작은 차이로 인해 결과 (특히 통계적 유의성에 따라)가 달라질 수 있으며 카테고리 수와 데이터 크기에 따라 데이터에서 중요한 정보가 많이 손실 될 수 있습니다.
다른 방법은 로지스틱 회귀로 지정할 수 있지만 회귀없는 독립 변수를 "스모 더 함수"로 포함 할 수있는 회귀 모델 인 일반화 된 가산 모형을 사용하는 것입니다. 기술적으로 R에서는 그다지 복잡하지 않지만 다른 소프트웨어 패키지에 대해서는 모르겠습니다. 이러한 모델은 종속 변수에 대한 비선형 관계를 식별하지만 출력에 제시 할 깔끔하고 깔끔한 숫자가 아니라 통계적 유의성에 대해 테스트 된 시각적 곡선을 얻을 수 있다는 단점이 있습니다. 따라서 비선형 변수가 결과 변수에 미치는 영향을 정량화하는 데 얼마나 관심이 있는지에 달려 있습니다.
마지막으로, 적어도 R을 사용하는 경우 위에서 설명한대로 일반화 된 가산 모형을 사용하여 로지스틱 회귀 모델에서 선형성의 가정을 테스트 할 수 있습니다.
이 책을 살펴보십시오 (귀하의 것과는 매우 다른 분야이지만 전혀 중요하지 않습니다) : http://www.amazon.com/Effects-Extensions-Ecology-Statistics-Biology/dp/0387874577 / ref = sr_1_1? ie = UTF8 & qid = 1440928328 & sr = 8-1 & keywords = zuur + ecology