이것이 올바른 스택 사이트라면 확실하지 않지만 여기에 있습니다.
.similiarity 방법은 어떻게 작동합니까?
와우 spaCy는 위대하다! tfidf 모델이 더 쉬울 수 있지만 한 줄의 코드로 w2v가 가능합니까?!
spaCy andrazhribernik 에 대한 10 줄의 튜토리얼에서 우리는 토큰, 전송, 단어 청크 및 문서에서 실행할 수있는 .similarity 방법을 보여줍니다.
후 nlp = spacy.load('en')
와 doc = nlp(raw_text)
우리는 토큰과 덩어리 사이 쿼리를 .similarity 할 수 있습니다. 그러나이 .similarity
방법 에서 장면 뒤에서 계산되는 것은 무엇 입니까?
SpaCy는 이미 매우 간단합니다 .vector
. 이는 GloVe 모델에서 학습 한 w2v 벡터를 계산합니다 ( .tfidf
또는 얼마나 멋진가 .fasttext
?).
모델이 단순히이 두 w2v, .vector, 벡터 간의 코사인 유사성을 계산하거나 다른 행렬을 비교합니까? 구체적인 내용은에서 명확하지 않다 문서 ; 어떤 도움을 주셔서 감사합니다!