통계적 학습, 내재적으로 또는 명시 적으로, 하나는 반드시 학습 집합에 있다고 가정 으로 구성되는 N 입력 / 응답 튜플 ( X I , Y I ) 되어 독립적 같은 조인트 분포로부터 인출 P ( X를 , Y ) 과
그리고 특정 학습 알고리즘을 통해 우리가 포착하려고하는 관계를 . 수학적으로이 iid 가정은 다음과 같이 씁니다.
나는 우리가이 가정이 실제로 거의 만족하지 않는다는 것에 모두 동의 할 수 있다고 생각한다. 관련 SE 질문 과 @Glen_b 및 @Luca의 현명한 의견을 참조하십시오 .
내 질문은 따라서 :
실제로 iid 가정이 정확히 어디에 중요해 집니까?
[문맥]
특정 모델을 훈련시키기 위해 이러한 엄격한 가정이 필요하지 않은 많은 상황 (예 : 선형 회귀 방법)을 생각할 수 있거나 적어도 하나는 iid 가정을 해결하고 강력한 결과를 얻을 수 있기 때문에 이것을 묻습니다. 실제로 결과 는 일반적으로 동일하게 유지 됩니다. 이는 선형 회귀 분석에서 이분산성 및 자기 상관 일관성있는 HAC 추정기 (예 : 이분산성 및 자기 상관 일관성)를 추론 할 수 있는 추론 입니다. Gauss-Markov 가정의 위반을 설명하기 위해 OLS 추정기의 유한 샘플 동작).
따라서 iid 가정은 특정 학습 알고리즘을 훈련시킬 수는 없지만 교차 검증과 같은 기술을 사용하여 모델의 일반화 능력을 안정적으로 측정 할 수 있습니다 . 통계 학습에서 우리가 실제로 데이터에서 배울 수 있다는 것을 보여주기 때문에 우리가 마지막 날에 관심을 가지는 것은 유일합니다. 직관적으로, 종속 데이터에 교차 유효성 검사를 사용하는 것이 ( 이 흥미로운 예 에서 설명 / 설명 된 것처럼) 낙관적으로 바이어스 될 수 있음을 실제로 이해할 수 있습니다 .
나를 위해 iid는 특정 모델 을 훈련 시키는 것과는 관련이 없지만 해당 모델의 일반 성과 관련된 모든 것을 제공합니다 . 이것은 Huan Xu 등이 발견 한 논문에 동의하는 것 같습니다 . "Markovian 샘플의 견고성 및 일반화"를 참조 하십시오 .
그것에 동의하겠습니까?
[예]
이 설명을 도울 수 있다면, 스마트 중에서 선택 수행 올가미 알고리즘 사용의 문제점을 고려 소정 기능 N의 트레이닝 샘플 ( X I를 , Y I ) 와 ∀ I = 1 , . . . , N의 X의 I = [ X I 1 , . . . , X i P ] 다음과 같이 더 가정 할 수 있습니다.
- 입력 된 의존 그러므로 (각 기능에 대한 예 IID를 가정을 위반 선도 J = 1 , . . , P는 우리가 관찰 N에 따라서 시간적 자기 상관을 도입 점 시계열)
- 조건부 응답 는 독립적입니다.
- 우리는 집니다.
교차 검증 방법 (전체 데이터 세트에서)을 사용하여 LASSO 불이익 계수 를 결정할 계획이라면 가정 할 때 iid 가정 위반이 문제를 일으킬 수 있는 방법은 다음과 같습니다. 이 학습 전략의 일반화 오류에 대한 느낌을 얻으십시오 (유용한 경우를 제외하고는 LASSO의 고유 한 장단점에 대한 논의를 남길 수 있습니다).