Google은 게시물의 게시 날짜를 어떻게 인식합니까


17

Google에서 무언가를 검색 할 때 때때로 게시물 / 기사의 게시 날짜가 아래에 표시됩니다. 또한 Wordpress 기반 사이트에있는 기사를 검색했으며 Google은 게시 날짜도 인식합니다.

웹 사이트의 소스를 열면 게시 날짜를 나타내는 특별한 태그 나 아무것도 표시되지 않습니다. 그것은 일반 div로만 작성되었으며 SE에 게시 날짜임을 알리는 특별한 태그가 없습니다 (페이지 주위에 다른 날짜가있을 수도 있음).

그래서 DOM 트리에서 Wordpress 게시 날짜의 정확한 위치를 Google에 하드 코딩 했습니까? 아니면 뭔가 빠졌습니까?

내 CMS를 사용하여 새 웹 사이트를 구축하고 있으며 날짜 게시 인식을 구현하는 방법을 찾으려고합니다.


2
당신은 확실히 무언가를 놓치고 있습니다 : 당신은 HTML 만 보았지만 페이지가 수정되었을 때 말하는 HTTP 헤더도 있습니다. 기사의 퍼머 링크에 대해 무엇을보고합니까? Google이 페이지를 얼마나 많이 변경했는지에 대한 자체 기록과 함께 사용한다고 생각하지만 실제 증거는 없으므로 답변이 아닌 의견입니다.
피터 테일러

예, 내 "거친"시도였습니다. 다른 사람들이 제안한 것처럼 HTML 이외의 요소 / 헤더 및 사이트 맵을
살펴볼 것입니다.

@Peter 의심 할 여지없이 HTTP 헤더 (특히 Last-Modified 헤더)는 SE가 사용하는 메트릭입니다. 그러나 기사의 "게시 된 날짜"를 결정하는 데있어서 그것이 적어도 구글이 게시 날짜로 표시하는 것은 아니라고 판단하는 데 큰 역할을한다고 생각합니다. (다른 SE는 '게시 된 날짜'를 표시하지 않는 것입니까?) 기사의 게시 날짜는 문서의 마지막 수정 날짜가 아닐 수 있습니다. 동적 사이트의 대부분의 페이지 (워드 프레스 게시물의 경우에도)는 현재 날짜 / 시간에 가깝게 반환되는 것으로 보입니다. IMO Last-Modified 헤더는 주로 캐싱에 사용됩니다.
MrWhite

나는 그것이 사이트 맵과 관련이 있다고 생각합니다 ..
Can Poyrazoğlu

HTTP 마지막으로 수정 된 stackoverflow.com/questions/204010/… 또는 일부 준 표준 HTML 메타 데이터 : stackoverflow.com/questions/4575967/… 는 다른 가능성이지만 Google이 실제로 사용하는지 확실하지 않습니다.
Ciro Santilli 新疆 改造 中心 法轮功 六四 事件

답변:


4

XML 사이트 맵 또는 RSS 피드 버전을 통해 Google, Yahoo 및 MSN과 같은 주요 검색 엔진을 통해 게시 데이터를 색인화해야합니다. 웹 사이트를위한 XML 사이트 맵을 생성하고 색인을 위해 웹 마스터 도구로 제출하십시오.


7

Google 페이지가 오래 색인되어 월간 변경되기 때문에 사실이 아님을 알고 있지만 4 주 전에 모든 메인 페이지가 업데이트 된 것으로 나타났습니다 . 정말 당황한 다음, 정말로 짜증을 내고 다시 당황한 ​​후에 마침내 문제를 발견했습니다. 법률 용어는 "최종 업데이트 : 2007 년 10 월 30 일"과 함께 숨겨진 div에서 제공되었으며 거의 ​​모든 페이지에 div가로드되었습니다. (등록시 팝업으로 인해) 삭제했는데 이제 날짜가 사라지거나 더 합리적인 것으로 수정됩니다.

기술적 세부 사항이나 자체 색인 기록보다 사이트의 의미를 더 많이 검사한다는 경고와 증거가 하나 더 있습니다.


페이지, RSS 피드 또는 XML 사이트 맵의 어느 곳에 나 페이지의 마지막 수정 날짜를 포함합니까?
MrWhite

사이트는 뉴스 사이트가 아니기 때문에 강조하지 않기를 바랍니다. 이상적으로는 내 홈페이지에는 날짜가 없습니다. 또한, 나는 아마 그들이 큰 소금 알갱이로 lastmod를 취할 것으로 생각합니다.
mmdanziger

7

게시물이나 기사의 게시 날짜가 <lastmod>XML 사이트 맵 의 항목 (다른 사람들이 제안한대로) 또는 해당 문제에 대한 Last-Modified HTTP 헤더를 기반으로한다는 사실은 매우 의심 스럽습니다 . XML Sitemap은 신뢰할 수있는 것이 아니라 권고 일뿐입니다. 문서의 마지막 수정 날짜는 기사의 (원본) 게시 날짜와 동일하지 않을 수 있습니다. 나는 페이지의 상단에 내 댓글에 언급 한 바와 같이 그리고, 문서의 마지막으로 수정 한 날짜는 아마 더 중요한 캐싱 및입니다 아마 크롤링 속도를 결정. 동적으로 생성 된 페이지의 Last-Modified HTTP 헤더는 종종 실제 날짜 / 시간과 매우 가깝습니다 (WordPress 블로그와 동일).

반면 RSS / Atom 피드에는이 특정 정보가 들어 있습니다. 실제로 콘텐츠에 게시 날짜가 포함되지 않은 Wordpress 사이트에서는 게시 날짜가 여전히 Google 검색 결과에 나타납니다. 그리고 내가 알 수있는 한, 이것은 RSS 피드의 날짜와 일치합니다.

편집 # 1 : 그러나 RSS 피드에 반드시 모든 페이지가 포함되어있는 것은 아닙니다. 대부분의 경우 최신 또는 가장 최근에 업데이트 된 페이지 만 포함해야 합니다. 그러나 Google이 이미 읽은 내용을 잊어 버릴 이유가 없으며 해당 페이지의 컨텐츠를 제공해도 변경되지 않았으며 마지막으로 수정 한 날짜도 마찬가지입니다.

RSS 피드가 없으면 Google이 페이지 내용을 분석 할만큼 영리하다고 생각합니다. 특히 날짜가 microformats 의 도움으로 '의미 적으로'표시되는 경우 . Google은 다음 내용을 기사에 포함 된 정식 게시 날짜로 볼 수 있습니다.

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Google은 확실히 hCard, hReview 등의 마이크로 포맷을 읽습니다 .

덧붙여서, 나는 이것을 제안하는 권위있는 것을 찾을 수 없다면 구글이 출판 날짜를 밝힐 것이라고 생각하지 않는다. 잘못된 '게시 날짜'는 아무에게도 사용되지 않으며 Google은 많은 관심을 가질 것이기 때문에 추론 데이터에 대해 '게시 날짜'를 추론하지는 않을 것입니다!

그리고 기록을 위해 (@Tom이 달리 제안하는 경우 :) 게시물 / 기사에 게시 날짜가 표시되어야한다고 생각합니다. 많은 사람들은 그렇지 않으며, 특히 기술 문제를 연구 할 때 독자에게는 실망 스러울 수 있으며 기사를 반쯤 읽은 것은 오래된 것입니다!

편집 # 2 : 그 후 @mmdanziger가 그의 답변에 세부적인 것과 같은 성가심 을 경험했습니다 . 내 오래된 사이트 중 하나에 모든 페이지 의 상단에 "Site Last Updated Sun 2012 년 6 월 17 일"(특별한 방법으로 표시되지 않음) 형식의 텍스트가 있습니다 ( JavaScript로 페이지에 작성 됨 !!). 이 같은 날짜 구글에 의해 포착 지금은 SERPS에 표시와 함께 여러 (전부는 아니지만) 페이지를 표시하고있다 -이 확실히 페이지의 게시 날짜가 아닙니다. Google은 단순히 "마지막 업데이트 ( datestring )"(JavaScript를 처리했습니다!) 형식의 문자열에 대한 페이지를 폐기하는 것 같습니다 . 이 특정 사이트에는 RSS 피드가 없습니다. 사이트에 Sitemap.xml 파일이 있지만 날짜가 다릅니다.

다른 사이트에서도 비슷한 동작을 발견했습니다.


이로부터 정확한 날짜를 어떻게 인식합니까? <div class="footer"> <div class="links"> April 24, 2011 | <a href=...이 곳은 내 게시물의 게시 날짜를 나타내는 유일한 장소이며 Google은 해당 게시물을 찾아서 검색 결과에 올바르게 표시합니다.
Can Poyrazoğlu

앵커 뒤에 특정 항목이 있습니까? 다시, 그렇지 않을 수 있습니다. RSS 피드 (문서의 META 태그에 링크 됨)도 있습니까?
MrWhite

"Google은 날짜를 어떻게 결정합니까?"라는 답변을 찾고있었습니다. 그러나 같은 것을 알아 차렸다! Google은 페이지 마지막에서 last-modified 또는 Sitemap.xml <lastmod> 헤더 대신 시간 문자열을 찾으려고합니다! 내 생각을 확인해 주셔서 감사합니다!
evilReiko

5

Google은 Sitemap과 RSS 피드를 사용하여 게시 된 날짜를 인식합니다. 표준 에 따라 xml 사이트 맵을 만들어 CMS에이 기능을 암시 할 수 있습니다 .

<lastmod>2011-08-18</lastmod>

2

Google의 Jonh Mueller에 따르면 :

우리는 다양한 신호를 사용하여 어떤 날짜를 보여 주어야하는지 또는 어떤 날짜를 보여 주어야하는지 결정합니다. 하나의 특정 속성에 묶여 있지 않습니다.

존 뮬러-트위터

그러나 Google은 다음 위치에서 웹 페이지에서 날짜를 찾을 가능성이 높습니다.

  • 머신 러닝을 사용하여 페이지를보기 쉽게
  • Schema.org의 구조화 된 데이터, 특히 페이지에서 데이터를 쉽게 볼 수있는 경우

1

나는 그것이 페이지의 모든 날짜를 지능적으로 찾고 그것이 사용하는 관련 날짜임을 확신 할 때 생각합니다.

SERP 클릭 가능성에 부정적인 영향을 줄 수 있다고 생각하기 때문에 때로는 조금 어렵습니다. 최근 기사 / 게시물 인 경우 일시적으로 긍정적 인 영향을 줄 수 있다고 생각하지만 내 사이트가 없으면 더 좋을 것이라고 확신합니다 (Google 검색자는 그렇지 않으면 나아지지 않을 수 있습니다!)

자신의 방법으로 만 Google을 통해 제어 할 수있는 옵션이 없습니다. 다음 중 하나를 수행 할 수 있습니다.

  • Google에서 감지하지 못하도록 날짜를 동적으로 생성 된 이미지로 교체하지만 시각적 정렬 / 일관된 글꼴 표시 / 접근성 등과 같은 다른 문제가 발생할 수 있습니다.
  • 페이지에서 모든 날짜를 제거하십시오 (관련 정보가있는 경우 방문자 / 사용자가 소스의 연령을 발견하려고 할 때 다시 실망 할 수 있음).

이러한 이유로 나는 그것을 무시할 것입니다.


나는 날짜를 제거하려고하지 않는다 :) 나는 내가 구축하고 있는 새로운 사이트에 날짜 기능을 추가 하려고한다 ..
Can Poyrazoğlu
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.