나는 구글에서 일하지 않고 실제로 그들이하는 일을 확실하게 말할 수는 없지만 타임 스탬프 를 처리 하는 현명한 방법은 변경 되지 않은<lastmod>
페이지를 다시 크롤링하는 시간을 낭비하지 않는 힌트 일 것 입니다.
따라서 매일 변경된 페이지를 모두보고하면 Googlebot은 변경된 페이지에만 집중하기보다는 원하는 순서대로 모든 페이지를 계속 크롤링합니다. 실제로 마지막 수정 타임 스탬프를 전혀보고하지 않은 것과 같습니다.
정확한 <lastmod>
타임 스탬프 를 제공하는 주된 이유 는 Google 색인에서 사이트 변경 사항을 더 빨리 표시하기 위해서입니다. 사이트에 수백 개의 페이지가있는 경우 Google에서 해당 페이지를 모두 크롤링하고 변경 사항을 찾는 데 다소 시간이 걸립니다. 그러나 최근에 어떤 페이지가 변경되었는지 Googlebot에 알려 주면 해당 페이지를 먼저 크롤링하여 나머지 시간에 많은 시간을 낭비하지 않아도됩니다.
물론 웹 마스터 도구에서 Googlebot의 크롤링 속도 를 높이고 최상의 결과를 기대할 수 있습니다. 그러나 실제로 업데이트 스크립트가 타임 스탬프를 유지하도록하기가 어렵지 않아야합니다. 예를 들어, 현재 다음과 같은 일을하고 있다고 가정합니다.
for each product do:
write new page content into product page file;
end do;
그렇다면 다음과 같이 변경하십시오.
for each product do:
read old page content from product page file into string A;
write new page content into string B;
if A is not equal to B then:
write string B into product page file;
end if;
end do;