블로그에서 텍스트 분석을 수행하는 소프트웨어가 있습니까? [닫은]


8

우리 회사는 지난 11 년간 고객의 Wordpress 2 블로그 게시물에 대한 PivotViewer 시각화를 만들려고합니다. 그러나 그렇게하려면 정렬 가능 범주로 사용하기 위해 다소 우연하고 불완전하며 일반적으로 열악한 태그를 편집해야합니다. 블로그 항목을 분석하고 단어 카운팅을 수행하여 우리가 다루고있는 것을 파악할 수있는 도구를 찾고 있습니다.

이상적으로는 다음과 같은 기능이 모두 있습니다.

  1. 단어 블랙리스트 (무시)
  2. 단어 형태소 분석
  3. 맞춤 동의어 병합
  4. 모든 용도 계산
  5. 단어가 나타나는 게시물 수를 세고 있습니다.

이런 종류의 텍스트 분석은 매우 일반적이라고 생각했지만 전체 블로그에서 이런 종류의 작업을 수행하는 소프트웨어를 찾을 수 없었습니다. 이를 수행 할 수있는 소프트웨어가 있습니까?


3
흥미 롭군 의심 스러우면 파이썬이 돌아 왔습니다.
제임스 T 스넬

그래 ... 난 이걸로 내 자신을 굴리지 않아도되기를 정말로 바라고있다.
Brian Bauman

친구가 위키 백과를 분석 한 것을 기억합니다. 내일 그와 함께 확인할 것입니다
Keltari

답변:


3

찾고있는 소프트웨어에는 "컨텐츠 분석" , "태그 클라우드" 또는 "메타 태그"와 같은 많은 제목이있을 수 있으며 "텍스트 분석"및 "텍스트 마이닝"과 같은 많은 제목이있을 수 있습니다 .

이러한 목적을위한 무료 및 상업용 소프트웨어 도구가 많이 있습니다.

이러한 도구에 대한 개인적인 경험은 없지만 시작하기에 좋은 장소는 무료 및 상용 도구를 수십 가지로 나열한 텍스트 분석 도구 입니다.

또 다른 목록은 텍스트 분석, 텍스트 마이닝 및 정보 검색 소프트웨어 입니다.


첫 번째 목록을 통해 길을 필터링했지만 무료 옵션에는 언어 분석보다 훨씬 많은 것이 포함되어 있지 않습니다. 두 번째 목록을 아직 보지 않았습니다. 내 롤링이 끝날 수 있습니다.
Brian Bauman

2

한 번 봐 가지고 Rapidminer 또는 웨카을

클라이언트 블로그 인 경우 데이터베이스 액세스 권한이있을 수 있습니다. 모든 기사를 일반 텍스트로 다운로드하고 위의 프로그램 중 하나를 사용하여 자연어 처리 질문 (1,2,3 및 5)을 처리하십시오.

문맥을 사용하여 단어의 의미를 자동으로 결정하는 것과 관련이 있기 때문에 사용 횟수는 실제로 자동화하기가 어렵습니다.


사용자가 아닌 모든 사용을 계산합니다. 그래도 제안에 감사드립니다.
브라이언 바 우먼

내가 잘못 읽었 어 여전히 자연어 처리를 위해 Rapidminer 또는 Weka를 확인하십시오. 즉, 데이터 세트가 크지 않다면 둘 다 메모리에 맞추려고하기 때문에
suweller

2

가장 컨텐츠 분석 소프트웨어 중 하나는 Provalis Research에서 설계 한 WordStat입니다.

WordStat는 QDA Miner 또는 SimStat를위한 텍스트 분석 모듈입니다. WordStat은 사전 접근 방식과 많은 알고리즘 탐색 또는 다양한 텍스트 마이닝 방법을 사용하여 컨텐츠 분석 방법을 결합합니다. WordStat는 기존 분류 사전을 새 텍스트 모음에 적용 할 수 있습니다. 또한 새로운 분류 사전의 개발 및 검증에도 사용될 수 있습니다. 수동 코딩과 함께 사용되는 경우이 모듈은 코딩 규칙을보다 체계적으로 적용하고 개인 하위 그룹 간의 단어 사용 차이를 발견하고 KWIC (Keyword In Context) 테이블을 사용하여 기존 코딩을 수정하는 데 도움을줍니다. WordStat은 특히 개방형 질문에 대한 응답, 인터뷰, 제목, 저널 기사, 대중 연설, 전자 커뮤니케이션 등과 같은 텍스트 정보를 연구하도록 설계되었습니다.

http://provalisresearch.com/products/content-analysis-software/



0

이러한 질문 중 일부는 블로그에서 Google 검색을 사용하여 빠르고 자체적 인 답변을 얻을 수 있습니다 (자체 도메인이있는 경우 가장 쉬운 방법).


0

Zemanta는 분석을 수행하며 태그와 링크를 제안 할 수 있습니다. 워드 프레스 플러그인이기도합니다.

유일한 문제 : 현재 상태이므로 각 게시물을 수동으로 열고 선택하고 저장해야합니다.

워드 프레스를위한 수많은 자동 태그 플러그인이 있습니다. 플러그인 파인더를 검색하고 시도해보십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.