큰 텍스트 모음에 존재하는 매우 큰 n-gram 데이터베이스를 만들어야하는 응용 프로그램을 작성 중입니다.
효율적인 3 가지 연산 유형이 필요합니다 : n-gram 자체에 의해 색인 된 검색 및 삽입, sub-n-gram을 포함하는 모든 n-gram을 쿼리합니다.
데이터베이스가 거대한 문서 트리 여야하고 Mongo와 같은 문서 데이터베이스가 작업을 잘 수행 할 수 있어야하는 것처럼 들리지만 규모에 관계없이 사용하지는 않았습니다.
Stack Exchange 질문 형식을 알고 특정 기술에 대한 제안을 요구하는 것이 아니라 규모에 맞게 이와 비슷한 것을 구현 해야하는 데이터베이스 유형을 분명히하고 싶습니다.