용지 회선에 깊은 가서는 원래 처음 모듈을 포함하는 GoogleNet 설명 :
시작 v2 로의 변경은 5x5 컨볼 루션을 두 개의 연속적인 3x3 컨볼 루션으로 대체하고 풀링을 적용했다는 것입니다.
Inception v2와 Inception v3의 차이점은 무엇입니까?
용지 회선에 깊은 가서는 원래 처음 모듈을 포함하는 GoogleNet 설명 :
시작 v2 로의 변경은 5x5 컨볼 루션을 두 개의 연속적인 3x3 컨볼 루션으로 대체하고 풀링을 적용했다는 것입니다.
Inception v2와 Inception v3의 차이점은 무엇입니까?
답변:
논문 Batch Normalization , Sergey et al, 2015. 제안 셉션-V1의 의 변종이다 아키텍처 GoogleNet 종이에 회선과 깊은가는를 , 그리고 그 사이에 그들은 셉션 (BN-부터)에 배치 정상화를 소개했다.
(Szegedy et al., 2014)에 설명 된 네트워크와의 주요 차이점은 5x5 컨볼 루션 레이어가 최대 128 개의 필터가있는 3x3 컨벌루션의 연속 된 2 개의 레이어로 대체된다는 것입니다.
그리고 컴퓨터 비전을위한 시작 아키텍처를 다시 생각 하는 논문 에서 저자들은 Inception-v2 및 Inception-v3을 제안했습니다.
에서 셉션-V2 , 그들은 인수 분해 (작은 회선에 인수 분해의 회선)와 인 셉션-V1에 약간의 변화를 소개했다.
우리는 전통적인 7x7 컨볼 루션을 3 개의 3x3 컨볼 루션으로 분해했습니다.
관해서 셉션-V3 , 그 BN-보조 추가 셉션-V2의 변종이다.
BN 보조는 컨볼 루션뿐만 아니라 보조 분류기의 완전히 연결된 레이어도 정규화되는 버전을 나타냅니다. 모델 [Inception-v2 + BN 보조]를 Inception-v3이라고합니다.
daoliker가 언급 한 것 외에
inception v2는 분리 가능한 컨벌루션을 깊이의 첫 번째 레이어 64로 활용했습니다.
종이에서 인용하다
우리의 모델 은 첫 번째 컨 볼루 셔널 레이어에서 깊이 곱셈기 8과 분리 가능한 컨벌루션 을 사용했습니다 . 이것은 훈련 시간에 메모리 소비를 늘리면서 계산 비용을 줄입니다.
왜 이것이 중요한가? v3 및 v4에서 삭제되었고 처음에는 resnet이 있었지만 나중에 다시 도입되어 모바일 네트워크 에서 많이 사용되었습니다 .
답은 컨볼 루션이있는 심층적 인 논문에서 확인할 수 있습니다 : https://arxiv.org/pdf/1512.00567v3.pdf
표 3을 확인하십시오. Inception v2는 컨볼 루션 관련 심층 논문에 설명 된 아키텍처입니다. Inception v3은 다른 학습 알고리즘 (RMSprop, 레이블 스무딩 정규화 기, 배치 표준이있는 보조 헤드를 추가하여 교육 향상 등)을 사용하는 동일한 아키텍처 (사소한 변경)입니다.
실제로 위의 답변은 잘못된 것 같습니다. 실제로, 그것은 명명에 큰 혼란이었다. 그러나 Inception-v4를 소개하는 논문에서 수정 된 것 같습니다 ( "Inception-v4, Inception-ResNet 및 잔여 연결이 학습에 미치는 영향"참조).
Inception 딥 컨벌루션 아키텍처는 여기에서 Inception-v1이라는 GoogLeNet (Szegedy et al. 2015a)으로 도입되었습니다. 나중에 Inception 아키텍처는 배치 정규화 (Ioffe and Szegedy 2015) (Inception-v2)를 도입하여 다양한 방식으로 개선되었습니다. 나중에 세 번째 반복 (Szegedy et al. 2015b)의 추가 인수 분해 아이디어를 통해이 보고서에서 Inception-v3이라고합니다.