Inception v2와 Inception v3의 차이점은 무엇입니까?


18

용지 회선에 깊은 가서는 원래 처음 모듈을 포함하는 GoogleNet 설명 :

여기에 이미지 설명을 입력하십시오

시작 v2 로의 변경은 5x5 컨볼 루션을 두 개의 연속적인 3x3 컨볼 루션으로 대체하고 풀링을 적용했다는 것입니다.

여기에 이미지 설명을 입력하십시오

Inception v2와 Inception v3의 차이점은 무엇입니까?


단순히 일괄 정규화입니까? 또는 Inception v2에 이미 일괄 정규화가 있습니까?
Martin Thoma

github.com/SKKSaikia/CNN-GoogLeNet 이 저장소에는 모든 버전의 GoogLeNet과 그 차이점이 있습니다. 시도 해봐.
Amartya Ranjan Saikia

답변:


22

논문 Batch Normalization , Sergey et al, 2015. 제안 셉션-V1의 의 변종이다 아키텍처 GoogleNet 종이에 회선과 깊은가는를 , 그리고 그 사이에 그들은 셉션 (BN-부터)에 배치 정상화를 소개했다.

(Szegedy et al., 2014)에 설명 된 네트워크와의 주요 차이점은 5x5 컨볼 루션 레이어가 최대 128 개의 필터가있는 3x3 컨벌루션의 연속 된 2 개의 레이어로 대체된다는 것입니다.

그리고 컴퓨터 비전을위한 시작 아키텍처를 다시 생각 하는 논문 에서 저자들은 Inception-v2 및 Inception-v3을 제안했습니다.

에서 셉션-V2 , 그들은 인수 분해 (작은 회선에 인수 분해의 회선)와 인 셉션-V1에 약간의 변화를 소개했다.

우리는 전통적인 7x7 컨볼 루션을 3 개의 3x3 컨볼 루션으로 분해했습니다.

관해서 셉션-V3 , 그 BN-보조 추가 셉션-V2의 변종이다.

BN 보조는 컨볼 루션뿐만 아니라 보조 분류기의 완전히 연결된 레이어도 정규화되는 버전을 나타냅니다. 모델 [Inception-v2 + BN 보조]를 Inception-v3이라고합니다.


3

daoliker가 언급 한 것 외에

inception v2는 분리 가능한 컨벌루션을 깊이의 첫 번째 레이어 64로 활용했습니다.

종이에서 인용하다

우리의 모델 은 첫 번째 컨 볼루 셔널 레이어에서 깊이 곱셈기 8과 분리 가능한 컨벌루션 을 사용했습니다 . 이것은 훈련 시간에 메모리 소비를 늘리면서 계산 비용을 줄입니다.

왜 이것이 중요한가? v3 및 v4에서 삭제되었고 처음에는 resnet이 있었지만 나중에 다시 도입되어 모바일 네트워크 에서 많이 사용되었습니다 .


1

답은 컨볼 루션이있는 심층적 인 논문에서 확인할 수 있습니다 : https://arxiv.org/pdf/1512.00567v3.pdf

표 3을 확인하십시오. Inception v2는 컨볼 루션 관련 심층 논문에 설명 된 아키텍처입니다. Inception v3은 다른 학습 알고리즘 (RMSprop, 레이블 스무딩 정규화 기, 배치 표준이있는 보조 헤드를 추가하여 교육 향상 등)을 사용하는 동일한 아키텍처 (사소한 변경)입니다.


1

실제로 위의 답변은 잘못된 것 같습니다. 실제로, 그것은 명명에 큰 혼란이었다. 그러나 Inception-v4를 소개하는 논문에서 수정 된 것 같습니다 ( "Inception-v4, Inception-ResNet 및 잔여 연결이 학습에 미치는 영향"참조).

Inception 딥 컨벌루션 아키텍처는 여기에서 Inception-v1이라는 GoogLeNet (Szegedy et al. 2015a)으로 도입되었습니다. 나중에 Inception 아키텍처는 배치 정규화 (Ioffe and Szegedy 2015) (Inception-v2)를 도입하여 다양한 방식으로 개선되었습니다. 나중에 세 번째 반복 (Szegedy et al. 2015b)의 추가 인수 분해 아이디어를 통해이 보고서에서 Inception-v3이라고합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.