심층 신경망 — 이미지 분류만을위한 것입니까?


14

깊은 신념이나 회선 신경망을 사용하여 찾은 모든 예는 이미지 분류, 대화 형 탐지 또는 음성 인식에 사용됩니다.

심층 신경망은 또한 특징이 구조화되지 않은 (예를 들어, 시퀀스 또는 그리드로 배열되지 않은) 고전적 재연 작업에 유용합니까? 그렇다면 예를 들어 줄 수 있습니까?


3
첫 문장은 컨볼 루션 신경망을 불러옵니다. 깊은 믿음의 네트워크와 혼동하는 것 같습니다. 둘 다 신경망의 형태 일지라도 그것들은 동일하지 않습니다.
MSalters

1
@msalters에 동의하지만 깊은 믿음 네트워크는 진정한 네트워크이고 성공이 제한적이지만 회선 네트워크는 회선 레이어의 하이브리드 적응 형 이미지 필터와 얕은 nn에 가깝습니다.
seanv507

"관측"이 "구조화되지 않음 (시퀀스 또는 그리드로 정렬되지 않음)"은 무엇을 의미합니까? 개별 픽셀이 그리드에 정렬되어 있다는 점에서 "구조화 된"이미지를 참조하십니까? 그러나 "관찰"이 아닌 "구조화 된"기능입니다 (개별 이미지일까요?).
amoeba는 Reinstate Monica가

나는 모든 컨볼 루션 네트워크가 깊고, 모든 딥 네트워크가 컨볼 루션이 아니며, 마찬가지로 모든 딥 신념 네트워크가 깊고 모든 딥 네트워크가 딥 신념 네트워크가 아니라고 말합니다. 실제로 당신은 깊지도 컨볼 루션도 아닌 딥 네트워크를 가질 수 있으며, 훈련하기 어려운 경향이 있습니다. 그래도 용어에 대한 무의미한 논쟁의 여지가 있습니다.
Lyndon White

비 구조적 (시퀀스 / 그리드 등이 아닌) 데이터에는 컨볼 루션 네트워크를 적용 할 수 없습니다. 기본적으로 이해가되지 않습니다. 컨볼 루션 네트워크는 입력을 푸리에 변환하는 것과 밀접한 관련이 있습니다 (예 : 시간 도메인에서 주파수 도메인으로 변환하는 시퀀스의 경우).
Lyndon White

답변:


8

심층 신경망으로 분류 할 수있는 이미지의 특징은 많은 기능 (RGB, 강도 등이있는 수십억 픽셀이 아니라 수백만 개일 수 있음)이 있으며 정확한 레이블이 있으면 노이즈가 많은 데이터가 아니라는 것입니다. 요즘 카메라는 매우 좋고 잘못 측정하지 않습니다. 인터넷 덕분에 이제 정확하게 레이블이 지정된 이미지가 많이 있습니다. 딥 네트워크는 임의로 복잡한 기능을 표현할 수 있습니다. 노이즈를 쉽게 과적 합할 수 있기 때문에 노이즈가 많은 데이터에는 문제가되기 때문에 많은 학습 방법이 복잡한 모델에 불이익을주는 경향이 있습니다. 그러나 이미지 인식의 경우 실제 기능은 실제로 매우 복잡해 보이며 기능 형태가 무엇인지 모릅니다. 많은 경우 관련 기능이 무엇인지조차 모릅니다.

딥 네트워크를 사용하여 이미지와 관련이없는 기능을 학습 할 수는 없습니다. 단점은 매우 과도하게주의를 기울여야한다는 것입니다. 대부분 과도하게 적합하기는하지만 계산 비용이 많이 들고 훈련하는 데 오랜 시간이 걸릴 수 있습니다 (요즘 병렬 SGD 및 GPU의 경우 큰 문제는 아님). 다른 단점은 모델 해석이 거의 없거나 전혀 없기 때문에 이미지 분류에 중요하지 않습니다. 우리는 컴퓨터가 침팬지와 오랑우탄의 차이점을 인식하도록 노력하고 있습니다. 공식에 대한 인간의 이해는 중요하지 않습니다. 다른 영역, 특히 의료 진단, 정책 연구 등의 경우 인간의 이해가 필요하거나 심지어 필요할 수도 있습니다.


5

물론 이미지 나 음성 인식 외에도 많은 문제에 대해 심층 신경망을 사용할 수 있습니다. 문제는 실제로 필요한 경우입니다.

심층 신경망은 단순한 MLP보다 훨씬 강력하지만 더 많은 리소스를 사용하고 개발하기가 더 어렵습니다. 따라서 이들은 실제로 복잡한 도메인에서 사용됩니다. 그것들을 사용하여 더 쉬운 문제를 해결할 수 있지만 일반적으로 더 간단한 모델도 좋은 결과를 얻습니다.

쉬운 문제에 깊은 신경망을 사용하는 것은 바주카로 파리를 죽이는 것과 같습니다. 확실히 죽일 것입니다.


2
이것은 대답이 아닙니다. 어려운 것은 무엇입니까? 주식 시장 예측 / 제한된 예에서 외삽 / ... 많은 어려운 문제가 모두 깊고 좋은가?
seanv507

나는 깊은 신경망이 무엇이든 해결할 수 있다고 말하지 않았습니다. 내가 의미하는 바는 많은 항목이있는 복잡한 도메인에서 사용된다는 것입니다. 나는 그들이 모든 문제를 해결할 수는 없다는 것을 알고 있지만이 질문의 요점은 아닙니다. 요점은 이미지 / 음성 인식 이외의 다른 문제에도 적용될 수 있지만 다른 모델을 적용 할 수있는 경우에는 고려해야 할 단점이 있다는 점입니다.
davidivad

5

나는 davidivad의 대답에 동의합니다. 그러나 심층 신경망을 이미지에 적용하는 것은 이미지 (및 더 중요한 것은 레이블이 붙은 이미지)가 비교적 저렴하다는 것입니다. 다른 영역에서는, 특히 전형적인 산업 또는 정부 기업의 제약 내에서 대규모로 데이터를 수집하는 것이 매우 비쌀 수 있습니다. 이 문제를 더럽히는 것은 많은 응용 분야에서 관심있는 현상이 상대적으로 드물기 때문에 배울만 한 몇 가지 사례가 있기 때문에 비교적 대규모의 데이터 수집 노력조차도 일부 클래스의 소수의 구성원을 산출 할 수 있다는 것입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.