구체적인 예나 과제가 없습니다. b- 스플라인 사용에 익숙하지 않아서 회귀 컨텍스트에서이 기능을 더 잘 이해하고 싶었습니다.
반응 변수 와 일부 예측 변수 의 관계를 평가한다고 가정합니다 . 예측 변수에는 몇 가지 숫자 변수와 범주 형 변수가 포함됩니다.
회귀 모델을 피팅 한 후 과 같은 숫자 변수 중 하나 가 중요하다고 가정합니다. 논리적 단계는 과적 합없이 관계를 적절히 설명 하기 위해 고차 다항식 (예 : 및 이 필요한지 여부를 평가하는 것 입니다.
내 질문은 :
어떤 시점에서 b- 스플라인 또는 간단한 고차 다항식 중에서 선택 했습니까? 예를 들어 R에서 :
y ~ poly(x1,3) + x2 + x3
vs
y ~ bs(x1,3) + x2 + x3
플롯을 사용하여이 둘 사이의 선택을 알리는 방법과 플롯에서 실제로 명확하지 않은 경우 어떻게되는지 (예 : 대량의 데이터 포인트로 인해)
와 의 양방향 상호 작용 항을 어떻게 평가 하시겠습니까?
위의 모델 유형에 따라 어떻게 변경됩니까?
고차 다항식을 사용하지 않고 항상 b- 스플라인을 피팅하고 높은 유연성을 페널티하는 것을 고려 하시겠습니까?
mgcv
이 얼마나 잘 되었는가? 매끄러움 선택은 자동이며 추론적인 방법이 잘 개발되었습니다.