반 감독 학습, 능동 학습 및 분류를위한 딥 러닝


19

모든 리소스가 업데이트 된 최종 편집 :

프로젝트의 경우 분류를 위해 기계 학습 알고리즘을 적용하고 있습니다.

도전 과제 : 레이블이 지정된 데이터와 레이블이없는 데이터가 훨씬 제한적입니다.

목표 :

  1. 반 감독 분류 적용
  2. 어떻게 든 반 감독 라벨링 프로세스 적용 (활성 학습이라고 함)

EM, Transductive SVM 또는 S3VM (Semi Supervised SVM)을 적용하거나 LDA를 사용하는 등의 연구 논문에서 많은 정보를 찾았습니다.이 주제에 관한 책은 거의 없습니다.

질문 : 구현과 실제 소스는 어디에 있습니까?


최종 업데이트 (mpiktas, bayer 및 Dikran Marsupial이 제공 한 도움말을 기반으로 함)

반 감독 학습 :

적극적인 학습 :

  • 이원론 자 : 텍스트 분류에 대한 소스 코드를 사용한 능동적 학습 구현
  • 웹 페이지 는 활발한 학습에 대한 훌륭한 개요를 제공합니다.
  • 실험적인 디자인 워크샵 : here .

딥 러닝 :


R 패키지 RTextTools가 있습니다. 내가 실수하지 않으면 언급 한 몇 가지 방법을 구현합니다.
mpiktas

안녕 mpiktas, 당신의 친절한 도움에 감사드립니다. 흥미로운 툴킷입니다. 그러나 "TextTools는 자동 텍스트 분류를위한 무료 오픈 소스 머신 러닝 패키지로 초보자와 고급 사용자 모두가지도 학습을 쉽게 시작할 수 있습니다. 앙상블 분류를위한 9 가지 알고리즘 (svm, slda, boosting, bagging, random forests, glmnet, 의사 결정 트리, 신경망, 최대 엔트로피) "
Flake

좋아, 여기 또 다른 시도가 있습니다 : Weka . 저자는 책을 썼으며, 목차는 반 감독 학습을 언급합니다. 나는이 장이 "... 불행히도 Weka에서는 구현되지 않았다"로 끝나지 않기를 진심으로 바란다 :)
mpiktas

드랏, 나는 구버전의 책을 얻었다! 이 출처를 지적 해 주셔서 감사합니다!
플레이크

답변:


8

딥 러닝이 매우 흥미로울 것 같습니다. 이것은 감독되지 않은 방식으로 사전 훈련되고 나중에 감독을 통해 미세 조정되는 딥 커넥 티비 스트 모델의 최신 필드입니다. 미세 조정에는 사전 훈련보다 훨씬 적은 샘플이 필요합니다.

혀를 적시려면 [Semantig Hashing Salakhutdinov, Hinton]을 추천 합니다. 로이터 코퍼스의 개별 문서에 대한 코드를 살펴보십시오 : (감독되지 않음!)

여기에 이미지 설명을 입력하십시오

구현 된 코드가 필요한 경우 deeplearning.net을 확인하십시오 . 그러나 즉시 사용할 수있는 솔루션이 없다고 생각합니다.


이것은 매우 흥미롭고 새로운 정보입니다. 물론 기본 구현은 더 나을 것이지만, 이것이 실제로 내가 원하는 것에 더 가까운 것을 아는 데 도움이됩니다. 감사.
플레이크

5

Isabelle Guyon (및 동료)은 잠시 동안 적극적인 학습에 대한 도전을 조직했으며, 절차는 여기 (공개 액세스)에 게시 됩니다 . 이것은 상당히 실용적이라는 장점이 있으며 편견없는 (구어적인 의미에서) 프로토콜 (임의의 패턴 선택은 놀랍게도 이길 수 없음) 하에서 다양한 접근 방식의 성능을 직접 비교할 수 있습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.