이를 설명하는 간단한 방법은 정규화가 노이즈에 맞지 않는 데 도움이되고 신호의 형태를 결정하는 데 큰 도움이되지 않는다는 것입니다. 딥 러닝을 거대한 영광스러운 함수 근사기로 생각하면 복잡한 신호의 모양을 정의하기 위해 많은 데이터가 필요하다는 것을 알 수 있습니다.
잡음이 없으면 NN의 복잡성이 증가하면 더 나은 근사값을 얻을 수 있습니다. NN의 크기에 어떤 형벌도 없을 것입니다. 모든 경우에 더 클 것입니다. 테일러 근사를 고려하면, 비 다항식 함수 (숫자 정밀도 문제 무시)에 대해 더 많은 항이 항상 좋습니다.
노이즈가 발생하기 시작하면 노이즈가 발생하면 분해됩니다. 따라서 여기에 도움이되는 정규화가 있습니다 . 노이즈에 대한 피팅을 줄일 수 있으므로 비선형 문제에 맞게 더 큰 NN을 구축 할 수 있습니다.
다음 토론은 내 대답에 필수적인 것은 아니지만 일부 의견에 답변하고 위 답변의 본문에 동기를 부여하기 위해 부분적으로 추가했습니다. 기본적으로 내 대답의 나머지 부분은 버거 식사와 함께 제공되는 프랑스 화재와 같습니다. 건너 뛸 수 있습니다.
(Ir) 관련 사례 : 다항식 회귀
다항식 회귀 분석의 장난감 예를 살펴 보겠습니다. 또한 많은 기능을위한 꽤 좋은 근사치입니다. 영역 의 함수를 살펴 보겠습니다 . 아래의 Taylor 시리즈에서 볼 수 있듯이 7 차 확장은 이미 꽤 적합하므로 7+ 다항식도 매우 잘 맞을 것으로 예상 할 수 있습니다.x ∈ ( − 3 , 3 )sin(x)x∈(−3,3)
다음으로, 우리는 다항식을 점진적으로 높은 차수를 7 개의 관측치가있는 작은 잡음이 많은 데이터 세트에 맞추겠습니다.
우리는 알고있는 많은 사람들이 다항식에 대해 들었던 것을 관찰 할 수 있습니다. 불안정하고 다항식의 순서가 증가함에 따라 격렬하게 진동하기 시작합니다.
그러나 문제는 다항식 자체가 아닙니다. 문제는 소음입니다. 다항식을 노이즈가 많은 데이터에 맞추면 신호의 일부가 아닌 노이즈에 적합합니다. 다음은 동일한 데이터 세트에 맞는 정확한 다항식이지만 노이즈가 완전히 제거 된 것입니다. 착용감이 좋습니다!
순서 6에 시각적으로 완벽하게 맞습니다. 순서 6 다항식을 고유하게 식별하기 위해 7 개의 관측치 만 있으면되므로 놀랍지 않습니다. 위의 Taylor 근사도에서 6이 이미 데이터 범위에서.sin(x)
또한 고차 다항식은이를 정의하기위한 관측치가 충분하지 않기 때문에 차수 6뿐만 아니라 적합하지 않습니다. 100 개의 관측치가 어떻게되는지 봅시다. 아래 차트에서 더 큰 데이터 세트를 사용하여 고차 다항식에 적합하게하여 더 나은 적합도를 달성하는 방법을 확인하십시오!
대단하지만 문제는 일반적으로 노이즈가 많은 데이터를 처리한다는 것입니다. 매우 시끄러운 데이터를 100 번 관찰 한 결과와 동일한 경우 어떻게되는지 확인하십시오 (아래 차트 참조). 고차 다항식은 끔찍한 진동 피팅을 생성합니다. 따라서 데이터 세트를 늘리는 것이 데이터를 더 잘 설명하기 위해 모델의 복잡성을 증가시키는 데 큰 도움이되지 않았습니다. 이것은 복잡한 모델이 신호의 모양뿐만 아니라 노이즈의 모양에도 더 잘 맞기 때문입니다.
마지막으로,이 문제에 대해 약간의 규칙적인 정규화를 시도해 봅시다. 아래 차트는 9 개의 다항식 회귀 분석에 적용되는 정규화 (서로 다른 벌칙을 가짐)를 보여줍니다. 이것을 9 다항식 적합 차수와 비교해보십시오. 적당한 수준의 정규화에서 고차 다항식을 시끄러운 데이터에 맞추는 것이 가능합니다.
분명하지 않은 경우 : 나는 다항식 회귀를 이런 식으로 사용하지 않는 것이 좋습니다. 다항식은 부분 적합에 적합하므로 조각 별 다항식을 선택하는 것이 좋습니다. 그것들을 전체 영역에 맞추는 것은 종종 나쁜 생각입니다. 왜냐하면 그것들은 실제로 위의 플롯에서 분명해야하기 때문에 노이즈에 민감하기 때문입니다. 노이즈가 수치인지 다른 소스에서 나오는지 여부는 이와 관련하여 중요하지 않습니다. 소음은 소음이며 다항식은 열정적으로 반응합니다.