답변:
사이트가 지나치게 크롤링되고 있다고 생각되면 (아마도 더 깊은 내용이 누락 된 경우) HTTP 헤더가 '마지막 수정 된'시간 등과 같은 항목에 대해 좋은 값을 반환하는지 확인해야합니다. . 보너스로 귀하의 사이트는 캐싱 (프록시 또는 브라우저 기반)과 관련하여 더 잘 작동하므로 조금 더 느리게 느낍니다.
서버 로그를 검토하여 크롤링되는 URL을 연구하는 것이 좋습니다. 그들이 동일한 URL을 계속해서 다시 크롤링하는 경우 분명히 문제가 있습니다. 이에 대한 일반적인 변형은 요청 변수를 사용하여 다양한 방법으로 표시 할 수있는 페이지가있는 경우입니다. Googlbot은 가능한 모든 변수 조합 을 크롤링하려고 시도 할 수 있습니다 .
크롤링 연산자로 발생한 예는 20 개의 제목 목록이있는 페이지로, 조합을 확장 할 수 있습니다. 기본적으로이 페이지에는 2 ^ 20 개의 서로 다른 URL이 있습니다!
Googlebot이 기본적으로 동일한 매개 변수를 사용하여 기본적으로 동일한 페이지를 계속 반복해서 크롤링하지 않는지 확인하십시오 (이 페이지에서 잡히는 것을 보았습니다)