게시물이나 기사의 게시 날짜가 <lastmod>
XML 사이트 맵 의 항목 (다른 사람들이 제안한대로) 또는 해당 문제에 대한 Last-Modified HTTP 헤더를 기반으로한다는 사실은 매우 의심 스럽습니다 . XML Sitemap은 신뢰할 수있는 것이 아니라 권고 일뿐입니다. 문서의 마지막 수정 날짜는 기사의 (원본) 게시 날짜와 동일하지 않을 수 있습니다. 나는 페이지의 상단에 내 댓글에 언급 한 바와 같이 그리고, 문서의 마지막으로 수정 한 날짜는 아마 더 중요한 캐싱 및입니다 아마 크롤링 속도를 결정. 동적으로 생성 된 페이지의 Last-Modified HTTP 헤더는 종종 실제 날짜 / 시간과 매우 가깝습니다 (WordPress 블로그와 동일).
반면 RSS / Atom 피드에는이 특정 정보가 들어 있습니다. 실제로 콘텐츠에 게시 날짜가 포함되지 않은 Wordpress 사이트에서는 게시 날짜가 여전히 Google 검색 결과에 나타납니다. 그리고 내가 알 수있는 한, 이것은 RSS 피드의 날짜와 일치합니다.
편집 # 1 : 그러나 RSS 피드에 반드시 모든 페이지가 포함되어있는 것은 아닙니다. 대부분의 경우 최신 또는 가장 최근에 업데이트 된 페이지 만 포함해야 합니다. 그러나 Google이 이미 읽은 내용을 잊어 버릴 이유가 없으며 해당 페이지의 컨텐츠를 제공해도 변경되지 않았으며 마지막으로 수정 한 날짜도 마찬가지입니다.
RSS 피드가 없으면 Google이 페이지 내용을 분석 할만큼 영리하다고 생각합니다. 특히 날짜가 microformats 의 도움으로 '의미 적으로'표시되는 경우 . Google은 다음 내용을 기사에 포함 된 정식 게시 날짜로 볼 수 있습니다.
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google은 확실히 hCard, hReview 등의 마이크로 포맷을 읽습니다 .
덧붙여서, 나는 이것을 제안하는 권위있는 것을 찾을 수 없다면 구글이 출판 날짜를 밝힐 것이라고 생각하지 않는다. 잘못된 '게시 날짜'는 아무에게도 사용되지 않으며 Google은 많은 관심을 가질 것이기 때문에 추론 데이터에 대해 '게시 날짜'를 추론하지는 않을 것입니다!
그리고 기록을 위해 (@Tom이 달리 제안하는 경우 :) 게시물 / 기사에 게시 날짜가 표시되어야한다고 생각합니다. 많은 사람들은 그렇지 않으며, 특히 기술 문제를 연구 할 때 독자에게는 실망 스러울 수 있으며 기사를 반쯤 읽은 것은 오래된 것입니다!
편집 # 2 : 그 후 @mmdanziger가 그의 답변에 세부적인 것과 같은 성가심 을 경험했습니다 . 내 오래된 사이트 중 하나에 모든 페이지 의 상단에 "Site Last Updated Sun 2012 년 6 월 17 일"(특별한 방법으로 표시되지 않음) 형식의 텍스트가 있습니다 ( JavaScript로 페이지에 작성 됨 !!). 이 같은 날짜 구글에 의해 포착 지금은 SERPS에 표시와 함께 여러 (전부는 아니지만) 페이지를 표시하고있다 -이 확실히 페이지의 게시 날짜가 아닙니다. Google은 단순히 "마지막 업데이트 ( datestring )"(JavaScript를 처리했습니다!) 형식의 문자열에 대한 페이지를 폐기하는 것 같습니다 . 이 특정 사이트에는 RSS 피드가 없습니다. 사이트에 Sitemap.xml 파일이 있지만 날짜가 다릅니다.
다른 사이트에서도 비슷한 동작을 발견했습니다.