Google이 특정 URL을 처음 색인화 한시기를 어떻게 알 수 있습니까? 본인이 소유하지 않은 경쟁 업체의 URL에서도 작동하는 솔루션을 선호합니다.
Google이 특정 URL을 처음 색인화 한시기를 어떻게 알 수 있습니까? 본인이 소유하지 않은 경쟁 업체의 URL에서도 작동하는 솔루션을 선호합니다.
답변:
URL의 수명을 알기 위해 www.example.com
원하는 URL 로 바꾸면이 링크를 따라갈 수 있습니다 .
https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl
예를 들어 Stack Overflow의 메타 사이트에 대한 Google의 결과는 다음과 같습니다.
그렇지 않으면 Wayback 시스템 은 좋은 솔루션이지만 내 경험으로는 덜 정확합니다.
.fr
로 변경하십시오 .com
.
www
이 시간에도 제거하여 검색 Dec 1, 2014
하여 URL의 나이가 될 수없는 가장 최근 날짜 인 날짜에 대한 결과를 표시 합니다. 내가 잘못 검색하고 있습니까? 아니면 아무것도 없어?
Zistoloen 은 Google이 페이지의 콘텐츠를 처음 색인 할 때 날짜를 표시하는 방법을 찾았습니다. 더 명확하게 설명 할 수 있다고 생각하기 때문에 답변에 추가하고 있습니다.
그런 다음 Google은 검색 결과에서 페이지에있는 콘텐츠를 발견 한 날짜를 표시합니다.
페이지가 새로운 콘텐츠로 업데이트되면 Google도이 날짜를 업데이트합니다. 따라서 "이 URL을 처음으로 색인화 한"날짜가 아니라 "이 컨텐츠를 처음으로 색인화 한"날짜에 가깝습니다.
페이지의 Google 캐시는 페이지의 마지막 색인 생성시기를 보여줍니다. Stack Exchange 홈페이지 가 오늘 마지막으로 색인 생성 되었음을 알 수 있습니다 .
다른 옵션은 인터넷 아카이브의 Wayback 시스템을 사용하는 것 입니다 . 과거의 페이지 모습을 보여줍니다. 페이지가 처음 게시 된시기를 파악할 수 있습니다. Google과 인터넷 보관소 모두 페이지를 처음 게시 한 직후 크롤링하고 사용합니다.
bing.com
. 내가 틀렸다면 미안해?
가되지 않을 수 있을 확실히 내가 그렇게 할 수있는 방법을 알고하지 않습니다 - 임의의 웹 페이지가 처음 구글에 의해 색인 때 찾을 수있는 방법. 실제로 필요한 이유가 없기 때문에 Google이 단순히 해당 정보를 저장하지 않을 수도 있습니다. 또한이 정보를 저장하더라도 제 3 자에게 정보를 자유롭게 제공 할 특별한 이유가 없습니다.
(자신의 페이지이고 이전 웹 서버 액세스 로그에 액세스 할 수있는 경우 쉽습니다. Googlebot에서 해당 페이지로 처음 방문한 로그를 검색하기 만하면됩니다. 그렇지 않으면 확실하게 말할 방법이 없습니다.)
어쨌든 Zistoloen과 Stephen Ostermiller가 답변에 설명 한 방법은 일반적으로 Google이 특정 URL을 처음 색인화 한 날짜를 나타내지 않습니다 . 오히려 Google 은 URL의 콘텐츠가 게시되었거나 마지막으로 업데이트 된 것으로 생각 하는 날짜를 보여 주며 종종 페이지 콘텐츠 자체에서 날짜를 "스니핑"하려는 Google의 다소 안정적인 시도를 기반으로합니다.
에서 이 비디오 , 구글의 매트 컷츠는이 날짜가 선택하는 방법에 잠시 감동. 편의상 아래 비디오 관련 부분 (약 2 : 09 ~ 2 : 22)을 아래에 기록했습니다.
"... 종종 날짜를 볼 수 있습니다. 또는 날짜를 처음 보았을 때, 해당 페이지를 크롤링 할 때마다 또는 페이지에서 찾을 수 있으면 해당 날짜를 추출 할 수 있습니다. "스 니펫의 시작 부분에서 바로 볼 수 있습니다."
사이트를 실행하는 소프트웨어가 페이지 자체에 정확한 생성 / 수정 날짜를 자동으로보고하는 블로그 게시물, Wiki 페이지 또는 Stack Exchange 질문과 같은 페이지의 경우 Google에서보고 한 날짜가 일치 할 가능성이 있습니다. 그러나 다른 유형의 페이지의 경우 Google의 날짜 스니퍼가 더 열심히 작동해야하며 항상 제대로 작동하지는 않습니다 (이 맥락에서 "올바른"이 무엇이든간에).
특히이 날짜는 기본적으로 페이지의 색인이 생성 된 기간을 결정하는 데 쓸모가 없습니다 . 두 가지 이유가 있습니다.
최근에 페이지가 수정되었고 수정 날짜가 페이지에 눈에 띄게 표시되는 경우 수정이 완전히 사소한 경우에도 Google은 해당 페이지를 "날짜"로 선택할 수 있습니다.
예를 들어, 이 오래된 위키 페이지 ( 2003 년에 처음으로 기록 된 archive.org )는 현재 페이지 하단에 표시된 것처럼 가장 최근에 편집 된 날짜 인 2014 년 11 월 10 일부터 Google에 의해 날짜가 표시됩니다. 그날에 일어난 변화? 페이지 하단에서 단일 링크를 제거하기 만하면됩니다.
반대로, 구글은 페이지에서 발견 된 아주 오래된 "발표일", 심지어 월드 와이드 웹 (World Wide Web)을 시작하기 이전 의 날짜조차 받아 들여서 기쁘다 .
예를 들어, 이전 프로그래밍 콘테스트의이 페이지 는 Google에서 1986 년 9 월 15 일까지 실제로 날짜를 표시합니다 (실제로는 페이지에 설명 된 이벤트 날짜). 마찬가지로 1970 년에 학생 파업을 기록한이 페이지 는 Google이 1970 년 5 월 10 일 (페이지에서 스캔 한 문서 중 하나의 날짜)에 날짜를 기입했으며 , 이 Linux 매뉴얼 페이지 는 Google이 11 월 4 일에 날짜를 표시합니다. 1989 (페이지에서 사용 된 임의의 예시 날짜).
Stephen과 Zistoloen이 설명하는 사용자 정의 날짜 범위 검색을 사용하지만 범위의 상단을 1991 년 8 월 6 일로 설정하면 더 많은 예제를 찾을 수 있습니다 .