이 질문은 Galit Shmueli의 논문 "설명 또는 예측"을 참조 합니다.
구체적으로 1.5 절, "설명과 예측이 다르다"에서 Shmueli 교수는 다음과 같이 썼다.
설명 모델링에서 초점은 기본 이론의 가장 정확한 표현을 얻기 위해 편향을 최소화하는 데 있습니다.
내가 신문을 읽을 때마다 당황했습니다. 추정의 편향을 최소화하는 것은 어떤 의미에서 기본 이론을 가장 정확하게 표현합니까?
또한 교수 Shmueli의 이야기를 지켜 여기 JMP 발견 정상 회의 2017에서 전달, 그녀는 말한다 :
수축 모델, 앙상블과 같은 것들, 당신은 그것들을 보지 못할 것입니다. 이러한 모델은 설계 상 전체 바이어스 / 분산을 줄이기 위해 바이어스를 도입하기 때문입니다. 그것이 그들이 거기에없는 이유입니다. 그렇게하는 것이 이론적으로 의미가 없습니다. 왜 모델을 의도적으로 편향되게 하시겠습니까?
이것은 실제로 내 질문에 불을 밝히지 않고 단순히 이해하지 못하는 주장을 재차 강조합니다.
이론에 많은 매개 변수가 있고이를 추정하기 위해 데이터를 스캔하지 않은 경우 추정 오차는 분산에 의해 좌우됩니다. 이 상황에서 능선 회귀와 같은 편향 추정 절차를 사용하는 것이 왜 부적절합니까?