배치 정규화와 ReLU는 모두 사라지는 기울기 문제에 대한 솔루션입니다. 배치 정규화를 사용하는 경우 시그 모이 드를 사용해야합니까? 또는 batchnorm을 사용할 때에도 가치가있는 ReLU 기능이 있습니까?
batchnorm에서 수행 된 정규화는 0의 활성화를 마이너스로 전송한다고 가정합니다. 이것은 batchnorm이 "dead ReLU"문제를 해결한다는 의미입니까?
그러나 탄과 물류의 지속적인 특성은 여전히 매력적입니다. batchnorm을 사용하는 경우 tan이 ReLU보다 더 잘 작동합니까?
나는 그 대답이에 달려 있다고 확신한다 . 그렇다면 경험에서 무엇이 효과가 있었으며 응용 프로그램의 두드러진 특징은 무엇입니까?