왜 모든 가중치를 동일한 값 (예 : 0.5)으로 초기화 할 때 역 전파가 작동하지 않지만 임의의 숫자가 주어지면 제대로 작동합니까?
가중치가 초기에 동일하다는 사실에도 불구하고 알고리즘이 오류를 계산하고 거기서부터 작동해서는 안됩니까?
왜 모든 가중치를 동일한 값 (예 : 0.5)으로 초기화 할 때 역 전파가 작동하지 않지만 임의의 숫자가 주어지면 제대로 작동합니까?
가중치가 초기에 동일하다는 사실에도 불구하고 알고리즘이 오류를 계산하고 거기서부터 작동해서는 안됩니까?
답변:
대칭 파괴.
모든 가중치가 동일한 값으로 시작하고 솔루션에서 동일하지 않은 가중치를 개발해야하는 경우 시스템은 학습 할 수 없습니다.
이는 가중치 값에 비례하여 가중치를 통해 오류가 다시 전파되기 때문입니다. 즉, 출력 장치에 직접 연결된 모든 숨겨진 장치는 동일한 오류 신호를 받게되며 무게 변화는 오류 신호에 따라 달라 지므로 해당 장치에서 출력 장치까지의 무게는 항상 같아야합니다. 시스템은 무게를 동일하게 유지하는 일종의 불안정한 평형 점에서 시작하지만 오류 표면의 일부 인접 점보다 높으며 일단이 점 중 하나로 이동하면 절대로 돌아 오지 않습니다. 작은 임의 가중치로 시스템을 시작하여이 문제를 방지합니다. 이러한 조건에서 이러한 종류의 대칭 문제는 발생하지 않습니다.