GLM 또는 OLS를 사용하여 복잡한 다중 비선형 관계를 모델링하는 데 필요한 단계를 보여주는 고급 선형 회귀 사례 연구를 찾고 있습니다. 기본 학교의 예를 넘어서는 자료를 찾는 것은 놀랍게도 어려운 일입니다. 제가 읽은 대부분의 책은 하나의 예측 변수의 BoxCox 또는 최상의 경우 자연스러운 스플라인과 결합 된 응답의 로그 변환 이상으로 진행되지 않습니다. 또한 지금까지 본 모든 예제는 개별 모델, 종종 단일 예측 변수 모델에서 각 데이터 변환 문제에 접근합니다.
BoxCox 또는 YeoJohnson 변환이 무엇인지 알고 있습니다. 내가 찾고있는 것은 반응 / 관계가 명확하지 않은 상세한 실제 사례 연구입니다. 예를 들어 반응이 엄격하게 긍정적이지 않으므로 (로그 또는 BoxCox를 사용할 수 없음) 예측 변수와 반응간에 비선형 관계가 있으며 최대 가능성 데이터 변환이 표준 0.33을 암시하지 않는 것 같습니다. 또는 0.5 지수 또한 잔차 분산이 일정하지 않은 것으로 밝혀 졌으므로 (그렇지 않음) 응답도 변환되어야하고 비표준 GLM 패밀리 회귀 또는 응답 변환 중에서 선택해야합니다. 연구원은 데이터의 과적 합을 피하기 위해 선택을 할 것입니다.
편집하다
지금까지 나는 다음과 같은 자료를 수집했다.
- 회귀 모델링 전략, F. Harrell
- 응용 계량 경제 시계열, W. 엔더
- R, G. Petris를 사용한 동적 선형 모델
- 응용 회귀 분석, D. 클라인 바움
- 통계 학습 소개, G. James / D. 위튼
나는 마지막 (ISLR) 만 읽었으며 고급 회귀 모델링보다 ML에 더 적합하지만 매우 좋은 텍스트 (시계에 별 5 개 5 개)입니다.
이력서에 대한 이 좋은 소식 도 도전적인 회귀 사건을 제시합니다.