비 이미지 비 NLP 작업에 대한 딥 러닝?


12

지금까지 컴퓨터 비전이나 자연어 처리에 대한 딥 러닝을위한 많은 흥미로운 응용 프로그램이 있습니다.

다른 전통적인 분야에서는 어떻습니까? 예를 들어, 나는 전통적인 사회 인구 통계 변수와 많은 실험실 측정을 가지고 특정 질병을 예측하려고합니다. 관찰 결과가 많으면 딥 러닝 응용 프로그램입니까? 여기서 네트워크를 어떻게 구성할까요? 모든 공상 레이어 (콘볼 루션 등)가 실제로 필요하지 않다고 생각합니까?! 깊게 만드시겠습니까?

내 특정 데이터 세트에서 무작위 포리스트, gbm 등과 같은 일반적인 기계 학습 알고리즘을 사용하여 정확도와 관련된 결과를 혼합했습니다. 이미지 인식에 대한 딥 러닝 경험이 제한적입니다.


1
"많은 관측치"에 따라 XGBoost와 같은 다른 접근 방식을 살펴 보는 것이 좋습니다. 딥 러닝 방식을 시도하거나 최고의 정확도를 얻는 것이 목표인지 명확하게 알 수 있습니까?
Neil Slater

내 목표는 이러한 경우에 가능하다면, xgboost 같은 설정 방법보다 더 높은 정확도를 달성하는 것입니다 @NeilSlater
spore234

1
가능하지만 실제로는 많은 데이터 가 없다면 내 경험 상으로는 불가능 합니다.
Neil Slater

Matlab은 "심층 학습 팁 및 요령"에 대한 설명서를 제공합니다. 나는 같은 질문을했고 페이지는 좋은 예와 함께 매우 유용한 가이드를 제공했습니다. 예를 들어 딥 러닝을 사용하여 시퀀스 / 시계열 분류 / 회귀에 시퀀스가 ​​필요할 수 있습니다.
Sami Navesi

답변:


10

예. 딥 러닝 기술을 사용하여 이미지가 아닌 데이터를 처리 할 수 ​​있습니다. 그러나 다른 모델 클래스는 여전히 신호 처리 및 관련 작업 이외의 신경망과 경쟁이 치열합니다.

비 신호 / 비 시퀀스 데이터에 대한 딥 러닝 접근법을 사용하려면 일반적으로 간단한 피드 포워드 멀티 레이어 네트워크를 사용합니다. 컨볼 루션 레이어 또는 풀링 레이어가 필요하지 않습니다. 그 이외의 최고의 아키텍처는 교차 검증을 통해 탐색해야하며, 딥 NN이 훈련을 위해 많은 계산을 수행하므로 시간이 오래 걸릴 수 있습니다.

Kaggle 경쟁에서 깊은 (-ish, 일반적으로 ~ 5 레이어) 신경 네트워크를 사용하려는 내 경험에서 :

  • 드롭 아웃은 여전히 ​​정규화 및 정확성 향상에 매우 효과적입니다.

  • 입력 정규화-일반적으로 표준 편차 1을 의미하는 0이 중요합니다.

  • 숨겨진 레이어 활성화 기능이 차이를 만들 수 있습니다. ReLU는 사라지는 그라디언트의 일부 문제를 줄이지 만 내 경험상 비 신호 데이터의 경우 덜 견고하므로 다른 형태를 원할 것입니다. 레이어가 몇 개인 경우 S 자형 또는 tanh는 여전히 작동합니다. 그렇지 않으면 누출 된 ReLU, PReLU, ELU 및 "죽은"뉴런의 문제를 패치하려는 다른 ReLU 변형을 살펴보십시오.

  • Adam, Adagrad 또는 RMSProp와 같은 딥 러닝을 위해 설계된 옵티 마이저 사용

  • Glorot과 같은 딥 러닝과 함께 작동하는 가중치 초기화 방법을 사용하십시오.

  • 배치 정규화 레이어 사용을 고려하십시오. 나는 많은 경험이 없지만 다른 사람들 이이 접근법을 잘 사용하는 것을 보았습니다.

이 모든 것에도 불구하고 XGBoost는 최소한의 조정 및 교육 노력으로 (문제는 물론 문제가있는 데이터에 따라) 깊이있는 NN을 일상적이고 쉽게 이길 수 있습니다. 비록 정확성이 모든 것이지만, 보장되지는 않지만, 깊은 NN의 앙상블과 XGBoost와 같은 다른 모델이 단독으로보다 더 나은 성능을 발휘할 수 있습니다.


1

분류 목적에 네트워크가 적합 할 수 있습니다. 이를 위해 네트워크에서 프로덕션에서 분류하도록 요청 될 데이터를 나타내는 데이터의 훈련 세트 및 테스트 세트를 정의 할 수 있어야합니다. 이것은 당신이 나쁘거나 합리적이거나 좋은 네트워크를 얻을 수 있는지 결정합니다.

나는 "심층 학습"이라는 용어를 오도하는 것으로 간주합니다.

훈련 및 테스트 세트를 만들 수 있다고 가정하면, 높은 수준에서

  • 다층 : 데이터에 순서가없고 구조의 위치가 고정 된 경우

  • 재귀 네트워크 : 분류에 데이터 순서가 중요한 경우

  • 컨볼 루션 : 데이터에 이미지와 같은 구조가 있지만 고정 된 위치가없는 경우

레이어 수와 같은 좋은 설정을 얻으려면 시행 착오가 필요합니다. 일종의 흑 마법입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.