나는 문서 모음에서 LDA를 사용했으며 몇 가지 주제를 발견했습니다. 내 코드의 출력은 확률을 포함하는 두 개의 행렬입니다. 하나의 의사 주제 확률과 다른 단어 주제 확률. 그러나 실제로 이러한 결과를 사용하여 새 문서의 주제를 예측하는 방법을 모르겠습니다. Gibbs 샘플링을 사용하고 있습니다. 아무도 방법을 알고 있습니까? 감사
1
"새 문서의 주제를 예측"한다는 것은 무엇을 의미합니까? 이 문서가 생성 된 단일 주제를 찾고 싶습니까? 문서에 대한 주제가 혼합되어 있습니까? 단어가 나온 주제로 새 문서의 각 단어에 레이블을 지정 하시겠습니까?
—
SheldonCooper
이 문서가 생성 된 단일 주제를 찾고 싶습니까? 문서에 대한 여러 주제를 찾고 싶습니까?-이 두 질문에 실제로 대답하고 싶습니다 ...하지만 내 말뭉치가 너무 커서 새 문서가있을 때마다 모든 모델을 재교육 할 수는 없습니다. 는 검사됩니다
—
Hossein