하이퍼 파라미터를 튜닝 할 때 유효성 검사 데이터에 대한 모델 성능을 평가하면 유효성 검사 데이터에 대한 정보가 유출되는 이유는 무엇입니까?

François Chollet의 Python을 사용한 딥 러닝에서는 다음과 같이 말합니다.

결과적으로 유효성 검증 세트의 성능을 기반으로 모델 구성을 조정하면 모델을 직접 학습하지 않아도 신속하게 유효성 검증 세트에 과적 합할 수 있습니다.

이 현상의 핵심은 정보 유출 개념입니다. 유효성 검사 세트에서 모델의 성능을 기반으로 모델의 하이퍼 파라미터를 조정할 때마다 유효성 검사 데이터에 대한 일부 정보가 모델로 누출됩니다 . 하나의 매개 변수에 대해이 작업을 한 번만 수행하면 정보가 거의 유출 되지 않고 유효성 검사 세트가 모델을 평가할 수 있습니다. 그러나이 실험을 여러 번 반복하고 (한 번의 실험 실행, 유효성 검사 세트 평가 및 결과로 모델 수정)이 과정에서 유효성 검사 세트에 대한 정보가 점점 더 많이 유출 될 것입니다.

neural-networks cross-validation hyperparameter

— fabiomaia
소스

BTW : 얼마나 자주 수행하는지뿐만 아니라 최적화 중 성능 평가 (목표 기능)의 불확실성에 따라 달라집니다.

— SX에 불만족 cbeleites

@cbeleites 죄송합니다, 무슨 뜻인가요?

— fabiomaia

최적화에 사용 된 원자가 결과가 완벽하다면 (즉, 체계적이거나 무작위적인 오류가 아닌 경우), 최적화는 진정으로 최적의 모델을 선택할 것입니다. 최적화 중에 변경하는 요소에 따라 변경되지 않는 한 최적화는 시스템 오류 (바이어스)를 허용 할 수도 있습니다. 이제 성능 추정치에 임의의 오차 (분산 불확실성)가 발생하면 어떻게되는지 고려하십시오. 실제 성능 인 "가로"위에 노이즈가 발생합니다.

— SX에 불만족 cbeleites

이 노이즈로 인해 일부 포인트 (하이 파라미터 설정)가 실제보다 더 좋아 보일 수 있습니다. 따라서 이러한 하이퍼 파라미터 설정은 실수로 (잘못) 선택 될 수 있습니다. 이러한 가능성은 a) 그러한 성능 값을 보는 횟수 및 b) 실제 성능과 비교 한 실제 성능 (실제 성능 향상과 비교)에 따른 노이즈의 양에 따라 증가합니다. 이것은 유효성 검사 결과의 재사용이 데이터 유출 인 이유가 아니라 각각의 과적 합이 발생하는 방식과 예상 할 수있는 심각한 문제에 대한 것입니다.

— SX에 불만족 cbeleites

유효성 검사 데이터를 사용하여 하이퍼 파라미터를 선택하기 때문에 정보가 유출됩니다. 본질적으로 복잡한 최적화 문제를 만들고 있습니다. 하이퍼 매개 변수의 손실을 최소화하십시오. $\phi$ 이러한 하이퍼 파라미터가 파라미터를 갖는 신경망 모델을 정규화하는 검증 데이터에 대해 평가 된 $\theta$ 특정 훈련 세트를 사용하여 훈련합니다.

매개 변수가 $\theta$ 훈련 데이터, 하이퍼 파라미터에 의해 직접 통보됩니다 $\phi$ 유효성 검사 데이터를 기반으로 선택됩니다. 또한 하이퍼 파라미터 때문에 $\phi$ 암묵적으로 영향 $\theta$ 유효성 검사 데이터의 정보는 선택한 모델에 간접적으로 영향을줍니다.

— Sycorax는 Reinstate Monica를 말합니다
소스

돌이켜 보면 이것은 명백했다. 그러나 "하나의 매개 변수에 대해이 작업을 한 번만 수행하면 정보가 거의 유출되지 않습니다"는 무엇을 의미합니까? 그 의미는 무엇이며 "여러 번 반복하는"다른 경우와 어떻게 대조됩니까?

— fabiomaia

유효성 검사 데이터에 대한 성능을 측정하고 2 가지 하이퍼 파라미터 구성 만 시도하고 최상의 모델을 선택한다고 가정합니다. 맹목적으로 운이 좋으면 유효성 검사 데이터를 과적 합시킬 가능성이 줄어 듭니다. 대조적으로, 당신이 시도한다고 가정

2^{10}

$2^{10}$ 하이퍼 파라미터 구성과 검증 데이터를 기반으로 최상의 모델을 선택합니다. 순전히 눈먼 운으로 검증 데이터를 과도하게 맞추는 위험이 더 큽니다. "포킹 경로의 정원"과 가짜 효과의 발견을 참조하십시오.

— Sycorax는 Reinstate Monica가

완벽하게 이해됩니다. 원본 책의 문구는 최고가 아닙니다. 감사합니다!

— fabiomaia

이 책의 문구는 훌륭합니다.

— Michael M

저자가 말하고있는 것을 이미 알고 있기 때문에 "우수한"것처럼 보일 수 있습니다. @Sycorax의 의견은 훨씬 더 명확하고 나에게 도움이되었습니다.

— fabiomaia