Google 그룹을 통한 Andrey Kutuzov의 답변은 만족 스럽습니다.
word2vec 알고리즘은 두 가지 모두를 기반으로한다고합니다.
사람들이 말할 때 distributional representation
, 그들은 일반적으로 언어 적 측면을 의미합니다. 의미는 맥락입니다. 회사와 다른 유명한 따옴표로 단어를 알고 있습니다.
그러나 사람들이 말할 때 distributed representation
대부분 언어학과 관련이 없습니다. 그것은 컴퓨터 과학 측면에 관한 것입니다. Mikolov 및 기타를 올바르게 이해하면 distributed
논문 의 단어
는 벡터 표현의 각 단일 구성 요소가 자체 의미를 갖지 않음을 의미합니다. 해석 가능한 기능 (예 : word2vec의 경우 단어 컨텍스트)은 숨겨져 distributed
해석 할 수없는 벡터 구성 요소 중에 숨겨져 있습니다 . 각 구성 요소는 여러 가지 해석 가능한 기능을 담당하며 각 해석 가능한 기능은 여러 구성 요소에 바인딩됩니다.
따라서 word2vec (및 doc2vec)는 어휘 의미론을 나타내는 방법으로 기술적으로 분산 표현을 사용합니다. 동시에 그것은 개념적으로 분포 가설을 기반으로합니다 : 그것은 분포 가설이 참 (단어 의미가 그들의 전형적인 맥락과 관련이 있기 때문에)에만 작동합니다.
그러나 물론 종종 용어 distributed
와 distributional
상호 교환 가능하게 사용되어 오해가 증가합니다. :)