감정 분석을 시도하고 있습니다. 단어를 단어 벡터로 변환하기 위해 word2vec 모델을 사용하고 있습니다. '문장'이라는 목록에 모든 문장이 있고이 문장을 다음과 같이 word2vec로 전달한다고 가정합니다.
model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3)
나는 단어 벡터에 멍청하기 때문에 두 가지 의심이 있습니다.
1- 피처 수를 300으로 설정하면 단어 벡터의 피처가 정의됩니다. 그러나이 기능들은 무엇을 의미합니까? 이 모델의 각 단어가 1x300 numpy 배열로 표시되는 경우이 300 가지 기능이 해당 단어의 의미는 무엇입니까?
2- 위 모델에서 'sample'파라미터로 표시되는 다운 샘플링은 실제로 무엇을합니까?
미리 감사드립니다.