나는 사람들이 주제 모델과 LDA에 대한 좋은 자습서 (빠르고 간단한)를 가지고 있는지, 일부 실제 매개 변수를 설정하는 방법, 의미 및 가능한 경우 실제 예제를 직관적으로 가르치고 싶습니다.
나는 사람들이 주제 모델과 LDA에 대한 좋은 자습서 (빠르고 간단한)를 가지고 있는지, 일부 실제 매개 변수를 설정하는 방법, 의미 및 가능한 경우 실제 예제를 직관적으로 가르치고 싶습니다.
답변:
R에서 작업하는 경우 LDA를 사용하여 영화 리뷰에서 주제를 모델링하는 방법에 대한 Carson Sievert의 자습서는 훌륭한 출발점입니다.
http://cpsievert.github.io/LDAvis/reviews/reviews.html
이 튜토리얼에서는 직관적 인 직관에 도움이되는 주제 및 단어 분포를 대화식으로 시각화 한 LDAvis를 사용합니다.
또한 짧은 주제는 아니지만 주제 모델에 대한 David M. Blei의 강의는 매개 변수의 의미를 이해하는 데 유용한 리소스입니다. http://videolectures.net/mlss09uk_blei_tm/
이 튜토리얼을 강력히 추천합니다 : 주제 모델링 및 MALLET 시작하기
시작하는 데 도움이되는 몇 가지 추가 링크는 다음과 같습니다.
좋은 소개 자료 (연구 논문 링크 포함) : http://www.cs.princeton.edu/~blei/topicmodeling.html
소프트웨어:
Biased Estimates 블로그 : 토픽 모델 읽기 목록
CLARIN-D 프로젝트는 Universität des Saarlandes CLARIN 센터 에서 주최 하는 Teaching ans Learning Materials Collection (TeLeMaCo) 사이트에서 주제 모델링 및 LDA에 대한 자습서에 대한 유용한 정보를 수집 했습니다 .
Machine Learning Plu의 Gensim 튜토리얼을 사용해 보는 것이 좋습니다 . NLP 및 LDA에 대한 전체적인 개요를 제공합니다. 데이터 사전 처리 방법, 기능 엔지니어링 및 LDA 적용 방법 등이 있습니다.