기계 학습의 차원 호핑


10

머신 러닝 (컨볼 루션 신경망 및 이미지 인식에서 발생)의 차원 호핑 문제는 무엇입니까? 나는 그것에 대해 봤지만 재료 모양 변형의 물리학에 관한 정보 만 얻었습니다. 기계 학습과 관련된 예를 통해 설명하면 더 도움이 될 것입니다. 누구 든지이 문제를 해결하거나 나를 도울 수있는 리소스를 가리킬 수 있습니까?

답변:


7

DataScience.SE에 오신 것을 환영합니다! 이 문제에 대해 들어 본 적이 없으므로 찾아 보았습니다. Geoff Hinton 이이 프레젠테이션 의 세 번째 슬라이드에서 설명합니다 .

물체를 인식하기 어렵게 만드는 더 많은 것들

• 관점의 변화는 표준 학습 방법으로 대처할 수없는 이미지의 변화를 유발합니다.

입력 차원 (예 : 픽셀) 사이의 정보 홉

• 환자의 연령이 때때로 체중을 코딩하는 입력 치수에 도달하는 의료 데이터베이스를 상상해보십시오!

– 기계 학습을 적용하기 위해 먼저이 차원 호핑을 제거하려고합니다.

다시 말해, 동일한 특징을 나타내는 동시에 하나의 입력 기능 차원에서 다른 입력 기능 차원으로 마이그레이션하거나 호핑하는 개념적 기능에 관한 것입니다. 인코딩 된 입력 차원에 변하지 않으면 서 기능의 본질을 캡처하거나 추출 할 수 있기를 원합니다.


Computer Vision에서 이미지의 위치가 변하지 않기를 원하지만 나이 예를 얻지 못합니다.
Martin Thoma

나는 나이와 몸무게가 의존한다는 것을 알기 위해 그것을 가져 갔지만 확실하지 않습니다. 내 프리젠 테이션이 아니야! 또는 문자 그대로 잘못된 열을 사용한다는 의미 일 수 있으며이를 감지하려고합니다.
Emre

@ sdream 나는 단지 의견을했다; 엠레가 대답했다. (그러나 여전히 수락해야합니다). CNN의 요점은 객체가 다른 곳에있을 때 하나의 피처가 변경 될뿐만 아니라 완전한 패턴이 다른 입력에 있다는 것입니다.
Martin Thoma

@Emre, 내가 당신의 대답에서 얻는 것은 특정 속성이 어떤 방향으로 입력 되든이 특정 속성이 유발하는 기능은이 속성의 입력 차원에 변하지 않아야한다는 것입니다. 감사! :). 더 구체적인 답변을 기다리는 중이라면 답장이 답변으로 표시됩니다.
sdream

3
연령 예제는 차원 호핑이없는 데이터 세트를 강조 표시해야합니다. 나이와 가중치는 예제간에 무작위로 값을 "홉핑"하거나 바꾸지 않습니다.이 값은 서로 호환되지 않으며 예제가 얼마나 이상한지 (그리고 선형 회귀와 같은 간단한 작업을 수행하는 것이 얼마나 어려운지를) 보여줍니다. 이미지의 픽셀 값 (및 많은 신호 처리 작업의 유사한 데이터)은 문제의 특성으로 인해 쉽게 교환되거나 이동합니다.
Neil Slater

7

내가 이해하는 한 문제는 다음과 같습니다. 이미지 인식에서 네트워크 입력은 픽셀 (회색조 또는 흑백의 경우 1과 0 만 가능) 일 수 있습니다. 예를 들어 손으로 쓴 숫자를 인식하려면 정확히 숫자 (예 : 검은 값)가 어디에 있는지 알 수없는 값으로 만 작업하기가 매우 어렵습니다.

픽셀 140은 검은 색입니까 아니면 142는 검은 색입니까? 두 경우 모두 3이 될 수 있습니다. 연령 / 체중 예에서 이러한 입력은 잘 정의되어 있습니다. 기능 2는 무게입니다. 기능 3은 나이입니다. 이러한 "치수"는 데이터 세트에서 "홉"되지 않아야합니다.

따라서 : 그림 훈련에서 "3"또는 "차"또는 "집"은 그림에서의 위치, 즉 픽셀 값, 즉 특징 / 입력 벡터, 즉 명확하게 정의 된 것과 반대되는 치수와 관계없이 인식되어야합니다. 환자 데이터와 같은 입력.

이미지 인식에서이 문제를 어떻게 해결합니까? 컨볼 루션과 같은 추가 트릭을 사용합니다.


2

나는 이전 답변을 읽었고, Nere Slater의 Emre 게시물에 대한 아래의 내용은 아래에 다시 복사되어 손톱에 부딪쳤다. "치수 도약"은 견해와 관련하여 기계 학습 개척자 명성의 힌튼 박사가 만든 용어입니다. Hinton 박사를 인용하자면, 일반적으로 입력 치수는 픽셀에 해당하며, 물체가 세상에서 움직이고 눈을 움직이지 않으면 물체에 대한 정보가 다른 화소에서 발생한다고 생각합니다. 연령과 체중은 쉽게 혼동되지 않는 입력 차원입니다. 힌튼 박사는 이러한 유형의 데이터 사이에서 잘못된 점을 발견하고 고칠 수 있음을 의미하기 위해 연령과 환자의 체중에 대한이 가능성이없는 차원 호핑 상황을 사용했습니다. 100 파운드 이상). 힌튼 박사가 언급 한 차원 호핑의 문제는 다른 시점 (예 : 물체가 움직일 수 있거나 다른 각도에서 바라보고 있기 때문에)이 변할 수 있다는 점입니다. 선형 신경망은이를 감지 할 수 없지만 컨볼 루션 신경망은 설계 상으로는 그렇지 않습니다.

"연령 예제는 차원 호핑이없는 데이터 세트를 강조 표시해야합니다. 연령과 가중치는 예제간에 무작위로 값을"홉핑 "하거나 바꾸지 않습니다. 서로 호환되지 않으며 예제가 얼마나 이상한지 (및 방법) 이미지의 픽셀 값 (및 많은 신호 처리 작업의 유사한 데이터)은 문제의 특성으로 인해 쉽게 교환되거나 이동합니다 – Neil Slater May 29 '16 at 18:01 "


1

기계 학습을위한 신경망에 관한 Hinton의 강의에서 직접 설명 ....

"차원 호핑 은 일부 입력의 차원에 포함 된 정보를 가져 와서 목표를 변경하지 않고 차원 사이에서 이동할 수 있을 때 발생합니다 . "잉크"가 포함 된 치수가 달라 지지만 (다른 치수로 이동 한 경우) 숫자에 할당 된 레이블이 변경되지 않았습니다. 데이터 세트에서 일관되게 발생합니다. 즉, 하나는 다른 버전의 번역 된 버전 인 두 자필 숫자를 포함하는 데이터 세트를 가질 수 있지만 여전히 해당 숫자의 해당 레이블을 변경하지는 않습니다. "


0

호핑은 이미지의 일부 또는 치수가 (주로) 치수 내에서 이동하고 때로는 다른 희미한 (다른 수용 필드)로 이동하는 문제와 관련이 있지만 출력은 동일하게 유지됩니다.

이 문제는 불균형 또는 등분 산 문제를 다루며 무게와 나이 예제처럼 쉽게 표현할 수 있습니다. 이 체중과 나이 호핑을 알고 있다면 쉽게 알고를 변경하고 올바른 결과를 얻을 수 있다고 가정하십시오. 그러나 데이터 / 정보 호핑과 같이 이미지 호핑도 발생합니다 .'4 '와'4 '가 여러 픽셀을 왼쪽으로 이동하여 다른 목표를 갖는 다른 클래스로 간주하면 이미지 호핑도 발생합니다.

Translation Invariance 또는 더 나은 등분 산 throguh 필터를 사용하면 이러한 이동 또는 호핑은 복잡성을 높이고 위치와 같은 정보를 버리는 비용이 많이 발생하지만 큰 문제는 아닙니다.

Pls는 당신이 내가 시도 할 더 명확성이 필요하면 알려주세요.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.