통계 및 빅 데이터 cosine-similarity

2

동일한 의미, 이는 벡터 u 와 벡터 세트 V 사이의 유사성 순위에 대해 동일한 결과를 생성 할 것 입니다. 거리 측정 (유클리드 거리, 코사인 유사성) 및 정규화 기술 (없음, l1, l2)을 매개 변수로 사용하는 벡터 공간 모델이 있습니다. 내 이해에서, 설정 [코사인, 없음]의 결과는 [유클리드, l2]와 동일하거나 적어도 실제로는 유사해야하지만, …

27 normalization natural-language euclidean cosine-distance cosine-similarity

4

음의 코사인 유사성 해석

내 질문은 어리석은 질문 일 수 있습니다. 그래서 미리 사과하겠습니다. Stanford NLP 그룹에 의해 사전 훈련 된 GLOVE 모델을 사용하려고했습니다 ( link ). 그러나 유사성 결과에 약간의 음수가 있음을 알았습니다. 즉각 단어 벡터 데이터 파일을 보라는 메시지가 나타납니다. 분명히, 단어 벡터의 값은 음수가 될 수있었습니다. 그것이 왜 코사인의 음의 유사성을 …

17 machine-learning word2vec cosine-similarity

1

코사인 유사성, 피어슨 상관 관계 및 z- 점수간에 관계가 있습니까?

이 세 가지 측정 값 사이에 어떤 관계가 있는지 궁금합니다. 나는 정의를 참조하여 그들 사이를 연결할 수없는 것 같습니다 (아마도 이러한 정의에 익숙하지 않고 이해하는 데 약간의 시간이 걸리기 때문일 수 있습니다). 코사인 유사성의 범위는 0-1 일 수 있으며 피어슨 상관 관계는 -1에서 1 사이 일 수 있으며 z 점수 …

16 correlation z-score cosine-similarity

1

자동 키워드 추출 : 코사인 유사성을 기능으로 사용

나는 문서 용어 행렬 을 가지고 있으며 이제 감독 학습 방법 (SVM, Naive Bayes, ...)을 사용하여 각 문서의 키워드를 추출하고 싶습니다. 이 모델에서는 이미 Tf-idf, Pos 태그를 사용합니다 ...미디엄MM 그러나 지금 나는 다음에 대해 궁금합니다. 용어 사이에 코사인 유사성 이있는 행렬 가 있습니다.씨CC 이 유사성을 내 모델의 기능으로 사용할 가능성이 …

12 text-mining feature-construction supervised-learning cosine-distance cosine-similarity

1

성능 측면에서 단어 포함 알고리즘

약 6 천만 개의 문구를 벡터 공간 에 삽입하려고 시도하고 그 사이 의 코사인 유사성 을 계산 하려고합니다. 나는 유니 그램 CountVectorizer과 bigram을 생성하는 맞춤형 내장 토큰 화 기능과 함께 sklearn을 사용 하고 있습니다. 의미있는 표현을 얻으려면 행 수에서 선형으로 엄청난 수의 열을 허용해야합니다. 이로 인해 엄청나게 희소 행렬이 발생하여 …

11 machine-learning natural-language word2vec word-embeddings cosine-similarity

3

코사인 유사성 대 유클리드 거리 (LSA)에 대한 K- 평균

낮은 차원 공간에서 문서 모음을 나타 내기 위해 잠재 의미 분석을 사용하고 있습니다. k- 평균을 사용하여 이러한 문서를 두 그룹으로 묶고 싶습니다. 몇 년 전, 나는 파이썬의 gensim을 사용하여 내 k- 평균 알고리즘을 작성 하여이 작업을 수행했습니다. 유클리드 거리를 사용하여 군집 중심을 결정한 다음 중심과 코사인 유사성을 기반으로 각 문서를 …

10 k-means svd lsa cosine-distance cosine-similarity

2

선형 변환 후 코사인 유사성이 어떻게 변합니까?

다음과 같은 수학적 관계가 있습니까? 코사인 유사성 심( A , B )sim⁡(A,B)\operatorname{sim}(A, B) 두 벡터의 ㅏAA 과 비BB, 코사인 유사성 심( MA , MB )sim⁡(MA,MB)\operatorname{sim}(MA, MB) 의 ㅏAA 과 비BB주어진 행렬을 통해 균일하지 않은 스케일링미디엄MM? 여기미디엄MM 대각선에 요소가 다른 주어진 대각선 행렬입니다. 계산을 시도했지만 간단하고 흥미로운 링크 (식)에 도달 할 …

9 linear-algebra cosine-similarity

«cosine-similarity» 태그된 질문