하이퍼 파라미터를 튜닝 할 때 유효성 검사 데이터에 대한 모델 성능을 평가하면 유효성 검사 데이터에 대한 정보가 유출되는 이유는 무엇입니까?


9

François Chollet의 Python을 사용한 딥 러닝에서는 다음과 같이 말합니다.

결과적으로 유효성 검증 세트의 성능을 기반으로 모델 구성을 조정하면 모델을 직접 학습하지 않아도 신속하게 유효성 검증 세트에 과적 합할 수 있습니다.

이 현상의 핵심은 정보 유출 개념입니다. 유효성 검사 세트에서 모델의 성능을 기반으로 모델의 하이퍼 파라미터를 조정할 때마다 유효성 검사 데이터에 대한 일부 정보가 모델로 누출됩니다 . 하나의 매개 변수에 대해이 작업을 한 번만 수행하면 정보가 거의 유출 되지 않고 유효성 검사 세트가 모델을 평가할 수 있습니다. 그러나이 실험을 여러 번 반복하고 (한 번의 실험 실행, 유효성 검사 세트 평가 및 결과로 모델 수정)이 과정에서 유효성 검사 세트에 대한 정보가 점점 더 많이 유출 될 것입니다.

하이퍼 파라미터를 튜닝 할 때 유효성 검사 데이터에 대한 모델 성능을 평가하면 유효성 검사 데이터에 대한 정보가 유출되는 이유는 무엇입니까?


BTW : 얼마나 자주 수행하는지뿐만 아니라 최적화 중 성능 평가 (목표 기능)의 불확실성에 따라 달라집니다.
SX에 불만족 cbeleites

1
@cbeleites 죄송합니다, 무슨 뜻인가요?
fabiomaia

1
최적화에 사용 된 원자가 결과가 완벽하다면 (즉, 체계적이거나 무작위적인 오류가 아닌 경우), 최적화는 진정으로 최적의 모델을 선택할 것입니다. 최적화 중에 변경하는 요소에 따라 변경되지 않는 한 최적화는 시스템 오류 (바이어스)를 허용 할 수도 있습니다. 이제 성능 추정치에 임의의 오차 (분산 불확실성)가 발생하면 어떻게되는지 고려하십시오. 실제 성능 인 "가로"위에 노이즈가 발생합니다.
SX에 불만족 cbeleites

1
이 노이즈로 인해 일부 포인트 (하이 파라미터 설정)가 실제보다 더 좋아 보일 수 있습니다. 따라서 이러한 하이퍼 파라미터 설정은 실수로 (잘못) 선택 될 수 있습니다. 이러한 가능성은 a) 그러한 성능 값을 보는 횟수 및 b) 실제 성능과 비교 한 실제 성능 (실제 성능 향상과 비교)에 따른 노이즈의 양에 따라 증가합니다. 이것은 유효성 검사 결과의 재사용이 데이터 유출 인 이유가 아니라 각각의 과적 합이 발생하는 방식과 예상 할 수있는 심각한 문제에 대한 것입니다.
SX에 불만족 cbeleites

답변:


11

유효성 검사 데이터를 사용하여 하이퍼 파라미터를 선택하기 때문에 정보가 유출됩니다. 본질적으로 복잡한 최적화 문제를 만들고 있습니다. 하이퍼 매개 변수의 손실을 최소화하십시오.ϕ 이러한 하이퍼 파라미터가 파라미터를 갖는 신경망 모델을 정규화하는 검증 데이터에 대해 평가 된 θ 특정 훈련 세트를 사용하여 훈련합니다.

매개 변수가 θ 훈련 데이터, 하이퍼 파라미터에 의해 직접 통보됩니다 ϕ유효성 검사 데이터를 기반으로 선택됩니다. 또한 하이퍼 파라미터 때문에ϕ 암묵적으로 영향 θ유효성 검사 데이터의 정보는 선택한 모델에 간접적으로 영향을줍니다.


1
돌이켜 보면 이것은 명백했다. 그러나 "하나의 매개 변수에 대해이 작업을 한 번만 수행하면 정보가 거의 유출되지 않습니다"는 무엇을 의미합니까? 그 의미는 무엇이며 "여러 번 반복하는"다른 경우와 어떻게 대조됩니까?
fabiomaia

4
유효성 검사 데이터에 대한 성능을 측정하고 2 가지 하이퍼 파라미터 구성 만 시도하고 최상의 모델을 선택한다고 가정합니다. 맹목적으로 운이 좋으면 유효성 검사 데이터를 과적 합시킬 가능성이 줄어 듭니다. 대조적으로, 당신이 시도한다고 가정210하이퍼 파라미터 구성과 검증 데이터를 기반으로 최상의 모델을 선택합니다. 순전히 눈먼 운으로 검증 데이터를 과도하게 맞추는 위험이 더 큽니다. "포킹 경로의 정원"과 가짜 효과의 발견을 참조하십시오.
Sycorax는 Reinstate Monica가

1
완벽하게 이해됩니다. 원본 책의 문구는 최고가 아닙니다. 감사합니다!
fabiomaia

이 책의 문구는 훌륭합니다.
Michael M

2
저자가 말하고있는 것을 이미 알고 있기 때문에 "우수한"것처럼 보일 수 있습니다. @Sycorax의 의견은 훨씬 더 명확하고 나에게 도움이되었습니다.
fabiomaia
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.