이 질문 에서 영감을 받아 , 매우 짧은 텍스트의 큰 컬렉션을 위해 주제 모델에 대한 작업이 수행되었는지 궁금합니다. 내 직감은 트위터가 그러한 모델에 대한 자연스러운 영감이어야한다는 것입니다. 그러나 일부 제한된 실험에서 표준 토픽 모델 (LDA 등)이 이런 종류의 데이터에서 성능이 좋지 않은 것으로 보입니다.
이 분야에서 수행 된 작업에 대해 아는 사람이 있습니까? 이 백서에서는 LDA를 Twitter에 적용하는 방법에 대해 설명하지만 짧은 문서 컨텍스트에서 더 나은 성능을 발휘하는 다른 알고리즘이 있는지에 관심이 있습니다.