답변:
DataScience.SE에 오신 것을 환영합니다! 이 문제에 대해 들어 본 적이 없으므로 찾아 보았습니다. Geoff Hinton 이이 프레젠테이션 의 세 번째 슬라이드에서 설명합니다 .
물체를 인식하기 어렵게 만드는 더 많은 것들
• 관점의 변화는 표준 학습 방법으로 대처할 수없는 이미지의 변화를 유발합니다.
– 입력 차원 (예 : 픽셀) 사이의 정보 홉
• 환자의 연령이 때때로 체중을 코딩하는 입력 치수에 도달하는 의료 데이터베이스를 상상해보십시오!
– 기계 학습을 적용하기 위해 먼저이 차원 호핑을 제거하려고합니다.
다시 말해, 동일한 특징을 나타내는 동시에 하나의 입력 기능 차원에서 다른 입력 기능 차원으로 마이그레이션하거나 호핑하는 개념적 기능에 관한 것입니다. 인코딩 된 입력 차원에 변하지 않으면 서 기능의 본질을 캡처하거나 추출 할 수 있기를 원합니다.
내가 이해하는 한 문제는 다음과 같습니다. 이미지 인식에서 네트워크 입력은 픽셀 (회색조 또는 흑백의 경우 1과 0 만 가능) 일 수 있습니다. 예를 들어 손으로 쓴 숫자를 인식하려면 정확히 숫자 (예 : 검은 값)가 어디에 있는지 알 수없는 값으로 만 작업하기가 매우 어렵습니다.
픽셀 140은 검은 색입니까 아니면 142는 검은 색입니까? 두 경우 모두 3이 될 수 있습니다. 연령 / 체중 예에서 이러한 입력은 잘 정의되어 있습니다. 기능 2는 무게입니다. 기능 3은 나이입니다. 이러한 "치수"는 데이터 세트에서 "홉"되지 않아야합니다.
따라서 : 그림 훈련에서 "3"또는 "차"또는 "집"은 그림에서의 위치, 즉 픽셀 값, 즉 특징 / 입력 벡터, 즉 명확하게 정의 된 것과 반대되는 치수와 관계없이 인식되어야합니다. 환자 데이터와 같은 입력.
이미지 인식에서이 문제를 어떻게 해결합니까? 컨볼 루션과 같은 추가 트릭을 사용합니다.
나는 이전 답변을 읽었고, Nere Slater의 Emre 게시물에 대한 아래의 내용은 아래에 다시 복사되어 손톱에 부딪쳤다. "치수 도약"은 견해와 관련하여 기계 학습 개척자 명성의 힌튼 박사가 만든 용어입니다. Hinton 박사를 인용하자면, 일반적으로 입력 치수는 픽셀에 해당하며, 물체가 세상에서 움직이고 눈을 움직이지 않으면 물체에 대한 정보가 다른 화소에서 발생한다고 생각합니다. 연령과 체중은 쉽게 혼동되지 않는 입력 차원입니다. 힌튼 박사는 이러한 유형의 데이터 사이에서 잘못된 점을 발견하고 고칠 수 있음을 의미하기 위해 연령과 환자의 체중에 대한이 가능성이없는 차원 호핑 상황을 사용했습니다. 100 파운드 이상). 힌튼 박사가 언급 한 차원 호핑의 문제는 다른 시점 (예 : 물체가 움직일 수 있거나 다른 각도에서 바라보고 있기 때문에)이 변할 수 있다는 점입니다. 선형 신경망은이를 감지 할 수 없지만 컨볼 루션 신경망은 설계 상으로는 그렇지 않습니다.
"연령 예제는 차원 호핑이없는 데이터 세트를 강조 표시해야합니다. 연령과 가중치는 예제간에 무작위로 값을"홉핑 "하거나 바꾸지 않습니다. 서로 호환되지 않으며 예제가 얼마나 이상한지 (및 방법) 이미지의 픽셀 값 (및 많은 신호 처리 작업의 유사한 데이터)은 문제의 특성으로 인해 쉽게 교환되거나 이동합니다 – Neil Slater May 29 '16 at 18:01 "
호핑은 이미지의 일부 또는 치수가 (주로) 치수 내에서 이동하고 때로는 다른 희미한 (다른 수용 필드)로 이동하는 문제와 관련이 있지만 출력은 동일하게 유지됩니다.
이 문제는 불균형 또는 등분 산 문제를 다루며 무게와 나이 예제처럼 쉽게 표현할 수 있습니다. 이 체중과 나이 호핑을 알고 있다면 쉽게 알고를 변경하고 올바른 결과를 얻을 수 있다고 가정하십시오. 그러나 데이터 / 정보 호핑과 같이 이미지 호핑도 발생합니다 .'4 '와'4 '가 여러 픽셀을 왼쪽으로 이동하여 다른 목표를 갖는 다른 클래스로 간주하면 이미지 호핑도 발생합니다.
Translation Invariance 또는 더 나은 등분 산 throguh 필터를 사용하면 이러한 이동 또는 호핑은 복잡성을 높이고 위치와 같은 정보를 버리는 비용이 많이 발생하지만 큰 문제는 아닙니다.
Pls는 당신이 내가 시도 할 더 명확성이 필요하면 알려주세요.