통계 절차 의 가정 은 무엇입니까 ?
나는 통계학자가 아니기 때문에 이것이 틀릴 수도 있지만, "가정"이라는 단어는 종종 비공식적으로 사용되며 다양한 것을 지칭 할 수 있다고 생각합니다. 나에게 "가정"은 엄밀히 말하면 이론적 인 결과 (정리)만이 가질 수있는 것입니다.
사람들이 선형 회귀의 가정에 대해 이야기 할 때 ( 여기 참조 에 대한 심도있는 토론), 그들은 일반적으로 언급하는 가우스 - 마르코프 정리 있다고 가정에서 상관 관계가없는, 평등 분산, 평균이 0 인 오류, OLS 추정이 청색입니다 즉, 편견이없고 최소 편차가 있습니다. Gauss-Markov 정리와 관련하여 "회귀 가정"이 무엇을 의미하는지 명확하지 않습니다.
티티엔티티n - 1
불이익 회귀 기술 가정
능형 회귀, 올가미, 탄성 그물, 주성분 회귀, 부분 최소 제곱 회귀 등 등의 정규화 된 회귀 기술을 고려하십시오. 이러한 방법의 요점 은 회귀 모수 의 편향 추정을 수행하고 기대치를 줄이는 것입니다. 바이어스-분산 트레이드 오프를 활용하여 손실.
β^
β^
그러나 능선 회귀가 항상 OLS를 능가하는 수학적 결과는 어떻습니까?
λβλ
이 결과는 실제로 어떤 가정도 요구하지 않으며 항상 사실이지만, 능선 회귀에는 가정이 없다고 주장하는 것이 이상합니다.
좋아,하지만 능선 회귀를 적용 할 수 있는지 어떻게 알 수 있습니까?
가정에 대해 이야기 할 수 없더라도 경험 법칙에 대해 이야기 할 수 있다고 말하고 싶습니다 . 능선 회귀는 상관 예측 자와의 다중 회귀의 경우에 가장 유용한 경향이있는 것으로 잘 알려져 있습니다. OLS를 능가하는 경향이있는 것으로 잘 알려져 있습니다. 이분산성, 상관 오류 또는 그 밖의 다른 경우에도 성능을 능가하는 경향이 있습니다. 따라서 간단한 경험 법칙에 따르면 다중 공선 데이터가있는 경우 능선 회귀 및 교차 유효성 검사가 좋습니다.
다른 유용한 경험 법과 거래의 비법이있을 수 있습니다 (예 : 심한 특이 치와 관련된 작업). 그러나 그것들은 가정이 아닙니다.
피피