소음이 일반화에 어떤 영향을 줍니까?


11

데이터의 노이즈를 증가시키는 것이 네트워크의 학습 능력을 향상시키는 데 도움이됩니까? 차이를 만들거나 해결중인 문제에 따라 달라 집니까? 일반화 프로세스에 전반적으로 어떤 영향을 미칩니 까?

답변:


9

합리적인 수준의 데이터 노이즈는 네트워크를 일반화하는 데 도움이 될 수 있습니다. 때로는 반대의 효과가 있습니다. 소음의 종류 ( "참"대 인공)에 부분적으로 의존합니다.

ANNAI FAQ 는 좋은 개요를 제공합니다. 발췌 :

실제 데이터의 노이즈는 훈련 세트의 규모에 관계없이 달성 할 수있는 일반화의 정확성을 제한하기 때문에 결코 좋은 일이 아닙니다. 반면에, 훈련 중에 입력에 인공 잡음 (지터)을 주입하는 것은 작은 훈련 세트가있을 때 부드러운 기능을 위해 일반화를 향상시키는 몇 가지 방법 중 하나입니다.

컴퓨터 비전과 같은 일부 분야에서는 일부 샘플을 복사하고 일부 노이즈 또는 기타 변환을 추가하여 학습 세트의 크기를 늘리는 것이 일반적입니다.


8

우리는 일반적으로 기계 학습 모델을 훈련 데이터의 두 가지 다른 부분, 즉 기본 일반화 가능한 진실 (신호)과 해당 데이터 집합에 고유 한 임의성 (소음)을 모델링하는 것으로 생각합니다.

두 부품을 모두 장착하면 훈련 세트 정확도가 증가하지만 신호를 장착하면 테스트 세트 정확도 (및 실제 성능)도 증가하는 반면 노이즈를 장착하면 양쪽 모두 감소합니다. 그래서 우리는 노이즈를 맞추기가 더 어려워지고 신호에 더 잘 맞도록하기 위해 정규화 및 드롭 아웃과 유사한 기술을 사용합니다.

훈련 데이터에서 소음의 양을 늘리는 것이 그러한 접근 방법 중 하나이지만 유용하지는 않습니다. 예를 들어 랜덤 지터와 대적 부스팅 비교 첫 번째는 느리고 간접적으로 견고성을 향상시키는 반면, 첫 번째는 견고성을 직접적으로 향상시킵니다.


1

추신 : 이미 여기에 제공된 매우 좋은 답변이 있습니다. 나는 누군가가 이것을 유용하게 사용할 수 있기를 희망 하면서이 답변에 추가 할 것입니다.

데이터 세트에 노이즈를 도입하면 실제로 모델에 긍정적 인 영향을 줄 수 있습니다. 실제로 이것은 일반적으로 dropout 과 같은 정규화 기와 동일한 작업을 수행하는 것으로 볼 수 있습니다 . 이 작업을 수행하는 몇 가지 예는 Zur at.al , Cires¸at.al 이며, 저자는 과적 합 을 줄이기 위해 데이터 세트에 노이즈를 성공적으로 도입했습니다.

잡기가 너무 많은 소음을 아는 것입니다. 노이즈를 너무 많이 추가하면 결과 데이터 세트에 더 이상 원래 데이터 세트와 충분히 유사하지 않을 수 있으므로 데이터 세트가 쓸모 없게 될 수 있으므로 완전히 다른 데이터 세트에 대한 교육을받을 수도 있습니다. 따라서 매우 높은 드롭 아웃 률과 같이 너무 많은 노이즈가 피팅 부족을 유발할 수 있습니다.

말이가는대로; 변화 균형은 삶의 향신료입니다 :).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.