나는 여전히 이것에 속도를 내고 있다는 사실에 대해 사과드립니다. 내 신경 활성화 기능에 tanh (map -1 to 1) 대 sigmoid (map 0-1)를 사용하는 장단점을 이해하려고합니다. 내 독서에서 그것은 약간의 차이가있는 사소한 것 같았습니다. 실제로 내 문제에 대해 나는 시그 모이 드가 훈련하기 쉽고 이상하다는 것을 알았습니다. 시그 모이 드는 일반적인 솔루션을 더 잘 찾는 것으로 보입니다. 이것은 시그 모이 드 버전이 훈련을 마치면 참조 (훈련되지 않은) 데이터 세트에서 잘 수행된다는 것을 의미합니다. 여기서 탄 버전은 훈련 데이터에 대한 정답을 얻을 수는 없지만 참조에 대한 성능이 떨어집니다. 이것은 동일한 네트워크 아키텍처를위한 것입니다.
내가 가진 직관 중 하나는 sigmoid를 사용하면 뉴런이 거의 완전히 꺼지기 쉬워 후속 레이어에 입력을 제공하지 않는다는 것입니다. tanh는 입력을 완벽하게 취소해야하기 때문에 시간이 좀 더 소요됩니다. 그렇지 않으면 항상 다음 레이어에 값을 제공합니다. 어쩌면이 직관이 잘못되었을 수도 있습니다.
긴 게시물. 결론적으로, 거래는 무엇이고, 큰 차이를 만들어야합니까?