어머니는 일종의 사서가되기 위해 온라인 과정을 밟고 있습니다.이 과정에서 부울 검색을 다루므로 데이터베이스를 효율적으로 검색 할 수 있지만 다음과 같은 소리가납니다.
"x OR y"를 검색하면 105 000 개의 적중이 발생하지만 x 만 검색하면 80 000 개의 적중이 발생하고 y 만 검색하면 35,000 개의 적중이 발생합니다. 결합 된 개별 검색이 115 000 개의 조회를 제공 할 때 검색 "x OR y"가 105 000 개의 조회를 제공하는 이유는 무엇입니까?
나에게 이것은 이상하게 들렸으므로 베이컨 과 샌드위치 라는 단어를 사용하여 직접 테스트했습니다 .
- 베이컨 만이 1 억 7 천만 개의 결과를 산출했습니다
- 만 샌드위치 굴복 312 개 000 000 결과를
- 베이컨 OR 샌드위치 는 491 000 000 결과를 주었다
그러나 나를 위해 합산하면 : 179 000 000 (베이컨) + 3 억 3, 000 000 (샌드위치) = 491 000 000 (베이컨 OR 샌드위치)
OR 쿼리로 인해 두 개별 쿼리를 합친 것보다 적중 횟수가 더 적은 이유는 무엇입니까?