«information-retrieval» 태그된 질문

11
인기 주제 또는 태그를 계산하는 가장 좋은 방법은 무엇입니까?
많은 사이트에서 "지난 24 시간 동안 가장 인기있는 주제"와 같은 통계를 제공합니다. 예를 들어 Topix.com은 "뉴스 트렌드"섹션에이를 표시합니다. 여기에서 가장 많이 인용되는 주제를 볼 수 있습니다. 주제에 대한 "버즈"도 계산하고 싶습니다. 어떻게해야합니까? 알고리즘은 항상 뜨겁지 않은 주제에 가중치를 부여해야합니다. 일반적으로 (거의) 아무도 언급하지 않는 주제는 가장 인기있는 주제 여야합니다. Google은 …

6
Python : tf-idf-cosine : 문서 유사성 찾기
Part 1 & Part 2 에서 사용할 수있는 튜토리얼을 따르고있었습니다 . 불행히도 저자는 실제로 두 문서 사이의 거리를 찾기 위해 코사인 유사성을 사용하는 마지막 섹션에 대한 시간이 없었습니다. 나는 stackoverflow 의 다음 링크의 도움으로 기사의 예제를 따랐 습니다. 위 링크에 언급 된 코드가 포함되어 있습니다 (삶을 더 쉽게 만들기 위해) …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.