환자의 나이 (년 단위로 측정 된 정수 수량)가 예측 변수 중 하나 인 예측 비용 모델을 작성 중입니다. 연령과 입원 위험 사이의 강력한 비선형 관계가 분명합니다.
환자 연령에 대한 처벌 회귀 스무딩 스플라인을 고려하고 있습니다. 에 따르면 통계 학습의 요소 (Hastie 등, 2009, 151), 최적의 매듭 배치는 회원 시대의 고유 한 값 당 하나 개의 매듭이다.
나이를 정수로 유지한다는 점을 감안할 때, 처벌 된 스무딩 스플라인은 데이터 세트에서 발견 된 연령 값 당 하나의 101 개의 연령 표시 변수가있는 능선 회귀 또는 올가미를 실행하는 것과 동등합니까 (참조를 위해 -1)? 그런 다음 각 연령 표시기의 계수가 0으로 줄어듦에 따라 초과 매개 변수화를 피할 수 있습니다.