이것은 Convolutional Networks를 사용한 Efficient Object Localization 이라는 논문 과 관련이 있으며, 내가 이해 한 것은 이탈이 2D로 구현 된다는 것입니다.
Spatial 2D Dropout의 구현 방식에 대한 Keras의 코드를 읽은 후 기본적으로 [batch_size, 1, 1, num_channels] 형태의 임의의 이진 마스크가 구현됩니다. 그러나이 공간적 2D 드롭 아웃은 모양 [batch_size, height, width, num_channels]의 입력 회선 블록과 정확히 어떤 관계가 있습니까?
필자의 현재 추측은 각 픽셀에 대해 픽셀의 레이어 / 채널 중 하나가 음수 값을 갖는 경우 해당 픽셀의 전체 채널은 기본적으로 0으로 설정됩니다. 이 올바른지?
그러나 내 추측이 맞다면 원래 입력 블록의 치수에 정확하게있는 모양의 이진 마스크 (batch_size, height, width, num_channels)를 사용하면 일반적인 요소 별 드롭 아웃이 어떻게됩니까? 바이너리 마스크의 모양을 입력의 모양으로 설정하는 tensorflow의 원래 드롭 아웃 구현)? 그러면 conv 블록의 픽셀이 음수이면 전체 conv 블록의 기본값은 0으로 설정됩니다. 이것은 내가 이해하지 못하는 혼란스러운 부분입니다.