CNN의 패턴 인식 기능이 이미지 처리로 제한됩니까?


21

Convolutional Neural Network를 사용하여 기존 이미지가없는 문제 영역 (예 : 추상 데이터를 그래픽으로 표현)에서 패턴 인식에 사용할 수 있습니까? 항상 덜 효율적입니까?

이 개발자 는 현재의 개발이 더 진행될 수 있지만 이미지 인식에 한계가 없다면 불가능하다고 말합니다.


1
적어도 두 가지 질문이 있습니다. 헤어지는 것에 대해 어떻게 생각하십니까? 또한 제목 질문에서 검색 한 내용을 확장 할 수 있으면 질문의 품질이 향상됩니다.
Eric Platon

@EricPlaton 조금 강화했습니다. 내 주요 질문은 CNN과 이미지 간의 관계의 성격에 관한 것입니다. 두 번째 질문에 대한 당신의 제안은 무엇입니까?
dynrepsys

감사합니다, 질문은 나에게 좋습니다 (지금 답변을 삭제해야하지만 ~). 두 번째 질문은 "캐치 란 무엇입니까?" "항상 덜 효율적입니까?" 누군가가 반례를 제기 할 수 있다면 여전히 좋습니다.
Eric Platon

"기존의 이미지를 그래픽으로 표현하여 기존 이미지가없는 문제 영역에서 패턴 인식에 Convolutional Neural Network를 사용할 수 있습니까?" 데이터를 이미지로 표현하고 CNN을 적용 할 수 있는지 묻고 있습니까? 100 개 기능 데이터 세트를 읽고 10x10 이미지로 표시하는 것과 같이?
rcpinto

답변:


10

CNN (Convolutional Nets)은 신호 처리에 일반적으로 사용되는 수학적 회선 (예 : 2D 또는 3D 회선)에 의존합니다. 이미지는 일종의 신호이며 컨볼 루션은 사운드, 진동 등에 동일하게 사용할 수 있습니다. 따라서 CNN은 원칙적으로 모든 신호에 대한 응용 프로그램을 찾을 수 있습니다.

실제로, 일부 사람들은 재귀 네트워크가 아닌 CNN을 사용하여 텍스트를 처리하는 NLP (Matthew Graves가 언급 한 것처럼)에 대한 작업이 이미 존재합니다. 다른 작업은 사운드 처리에 적용됩니다 (여기서는 참조하지 않지만 아직 게시되지 않은 작업이 진행 중임).


원본 내용 : 원래 제목 질문에 대한 답변으로 현재 변경되었습니다. 아마도 이것을 삭제해야 할 것 입니다.

대적 네트워크 (및 관련)에 대한 연구에 따르면 깊은 네트워크 조차도 쉽게 속일 수 있으므로 인간이 그것을 보았을 때 임의의 소음으로 보이는 개 (또는 다른 물체)를 볼 수 있습니다 (이 기사에는 명확한 예가 있습니다).

또 다른 문제는 신경망의 일반화 능력입니다. 컨볼 루션 네트는 다른 기술보다 더 나은 방식으로 일반화 할 수있는 기능으로 세계를 놀라게했습니다. 그러나 네트워크에 고양이 이미지 만 먹이는 경우 고양이 만 인식 할 수 있습니다 (적대적 네트워크 결과에서 볼 수 있듯이 모든 곳에서 고양이를 볼 수 있음). 즉, 심지어 CN이 힘든 시간을 너무 일반화가 넘어 그들이 배운 무엇을.

인식 한계는 정확하게 정의하기 어렵습니다. 단순히 학습 데이터의 다양성이 한계를 뛰어 넘고 있다고 말하고 싶습니다.


5

간단한 대답은 "아니오, 이미지에만 국한되지 않습니다"입니다. CNN은 자연 언어 처리에도 사용되고 있습니다. ( 소개는 여기 를 참조 하십시오 .)

그래픽 데이터에 적용되는 것을 보지 못했지만 보지 못했습니다. 시도해야 할 몇 가지 분명한 점이 있으므로 작동한다고 낙관적입니다.


3

길쌈 신경 네트워크 게임 (예에서, 이미지 인식뿐만 아니라 비디오 분석 및 인식, 자연 언어 처리를위한뿐만 아니라 적용 할 수있는 이동 ) 또는를위한 신약 개발 분자 생물학 단백질 사이의 상호 작용 예측하여 위키를 .

따라서보다 완전하게 연결된 레이어에 연결된 회선 및 서브 샘플링 레이어를 사용하여 다양한 문제에 사용할 수 있습니다. 동일한 수의 숨겨진 장치를 가진 완전히 연결된 네트워크보다 적은 수의 매개 변수를 가지고 있기 때문에 훈련하기가 더 쉽습니다. UFLDL


3

컨볼 루션 신경망은 패턴이 국소 적으로 상관되고 번역 가능한 곳이면 어디든 사용할 수 있습니다 (이동 가능). CNN에는 입력의 모든 곳에서 특정 로컬 패턴을 찾는 필터가 포함되어 있기 때문입니다. 그림, 텍스트, 시계열 등에서 로컬 및 번역 가능한 패턴을 찾을 수 있습니다.

데이터가 관련없는 순서를 가진 기능 모음과 비슷하다면 CNN을 사용하는 것이 이치에 맞지 않습니다. 이 경우 입력 벡터에서 더 멀리 떨어져있는 지형지 물이 포함 된 패턴을 감지하는 데 문제가있을 수 있습니다. 정보를 잃지 않고 입력 벡터의 데이터 포인트를 재정렬 할 수있는 경우 데이터에서 로컬 및 변환 가능한 패턴을 찾을 수 없습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.