이상적인 자체 호스팅 검색 엔진은 무엇입니까? [닫은]


11

여러 블로그와 포럼, 수백 개의 정적 페이지, 많은 PDF 파일 및 기타 여러 문서 유형으로 구성된 내부 (인트라넷) 사이트가 있습니다. 그것은 지난 몇 년 동안 느슨하게 붙어 있었으며 이제는 그것을 유지하는 것이 나의 일입니다.

이상적으로 스스로 호스팅 할 수있는 검색 엔진을 찾고 있습니다.

  1. 검색 할 데이터베이스 정보 및 테이블이 제공된 경우 블로그 / 포럼 데이터베이스를 직접 검색 할 수 있습니다.

  2. 대부분의 텍스트 문서를 처리합니다 (PDF / DOC / ODF)

  3. 오픈 소스이거나 구매 후 소스 코드에 액세스 할 수 있습니다

어떤 언어 나 플랫폼으로 작성되었는지는 중요하지 않습니다. 일반적으로 Google 사이트 검색 만 사용하지만 인트라넷에는 옵션이 아닙니다.

답변:




2

Lucene을 기반으로하는 SearchBlox 가 귀하의 요구를 충족시킬 수 있습니다. 무료이며 크롤러가 제공됩니다.


인트라넷 훨씬 아닌 25K URL을, 무료
cweiske

@cweiske Ambar를 확인하십시오. ElasticSearch를 기반으로하며 무료입니다. github.com/RD17/ambar
Ilya P

0

일반적으로 Google 사이트 검색 만 사용하지만 인트라넷에는 옵션이 아닙니다.

실제로 Google 검색 어플라이언스는 인트라넷에 대한 Google 사이트 검색과 동일합니다. 그러나 이것은 오픈 소스가 아닙니다 (Google 사이트 검색은 눈치 채지 못한 경우에도 마찬가지입니다).


나는 그것을 보았다. 코드에 액세스 할 수있는 것을 정말로 원합니다. 예산 부서에서도 약간 무겁습니다.
Tim Post

Google 검색 어플라이언스 외에도 경쟁력있는 "Thunderstone"과 유사한 제품이 있습니다. 나는 과거에 둘 다 사용했습니다. 그것이 당신에게 효과가 없을 수도 있지만, 나는 그 질문에 걸려 넘어지는 다른 사람들을 위해 글을 올릴 것이라고 생각했습니다.
digit1001
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.