우리 회사는 지난 11 년간 고객의 Wordpress 2 블로그 게시물에 대한 PivotViewer 시각화를 만들려고합니다. 그러나 그렇게하려면 정렬 가능 범주로 사용하기 위해 다소 우연하고 불완전하며 일반적으로 열악한 태그를 편집해야합니다. 블로그 항목을 분석하고 단어 카운팅을 수행하여 우리가 다루고있는 것을 파악할 수있는 도구를 찾고 있습니다.
이상적으로는 다음과 같은 기능이 모두 있습니다.
- 단어 블랙리스트 (무시)
- 단어 형태소 분석
- 맞춤 동의어 병합
- 모든 용도 계산
- 단어가 나타나는 게시물 수를 세고 있습니다.
이런 종류의 텍스트 분석은 매우 일반적이라고 생각했지만 전체 블로그에서 이런 종류의 작업을 수행하는 소프트웨어를 찾을 수 없었습니다. 이를 수행 할 수있는 소프트웨어가 있습니까?