Google이 URL을 처음 색인화 한시기를 어떻게 알 수 있습니까?


16

Google이 특정 URL을 처음 색인화 한시기를 어떻게 알 수 있습니까? 본인이 소유하지 않은 경쟁 업체의 URL에서도 작동하는 솔루션을 선호합니다.


1
대답이 "아니오"일 가능성이 큽니다. Google은 이러한 정보를 저장하지 않을 수도 있습니다 (특별한 이유가 없기 때문에).
Ilmari Karonen

1
다른 사람들이 언급했듯이이 정보를 얻을 수 없습니다. 서버 로그에 액세스 할 수 있으면 서버가 처음 크롤링 된시기를 알 수 있었지만 색인이 생성 된 것은 아닙니다.
John Mueller

답변:


15

URL의 수명을 알기 위해 www.example.com원하는 URL 로 바꾸면이 링크를 따라갈 수 있습니다 .

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

예를 들어 Stack Overflow의 메타 사이트에 대한 Google의 결과는 다음과 같습니다. 여기에 이미지 설명을 입력하십시오

그렇지 않으면 Wayback 시스템 은 좋은 솔루션이지만 내 경험으로는 덜 정확합니다.


3
Google의 기능이 영어로도 제공됩니까? 프랑스어 버전에 연결했습니다.
Stephen Ostermiller

1
@StephenOstermiller tld를에서 .fr로 변경하십시오 .com.
MDMoore313

2
귀하의 답변에 대한 @Zistoloen +1이지만 귀하의 질문에 의문이 있습니다. 당신이 말했듯이 예제 쿼리를 사용하여 www.stackexchange.com검색 했지만 결과가 표시되지 않습니다. www이 시간에도 제거하여 검색 Dec 1, 2014하여 URL의 나이가 될 수없는 가장 최근 날짜 인 날짜에 대한 결과를 표시 합니다. 내가 잘못 검색하고 있습니까? 아니면 아무것도 없어?
Sathiya Kumar

2
나는이 답변을 "도난 당하고"더 나은 설명으로 내 답변에 추가했습니다. 이것은 훌륭한 속임수입니다.
Stephen Ostermiller

6
@Stephen & Zistoloen : 일반적으로 Google에서 페이지의 색인을 생성 한 날짜 가 아닙니다 . 일부 테스트에 따르면이 방법을 통해 표시되는 날짜는 페이지의 콘텐츠에서 가져온 것으로 보입니다 (Google에서 "게시 된"또는 "마지막으로 수정 한"날짜로 보이는 것으로 생각되는 경우). 날짜는 Google이 페이지에서 (실질적인?) 변경을 마지막으로 관찰 한 날짜를 기준으로 콘텐츠에서 발견됩니다. 페이지가 처음으로 발행 후 변경되지 않을 경우 물론,이 출판 날짜와 동일하게 발생하지만, 그 보장은 없습니다.
Ilmari Karonen

8

Zistoloen 은 Google이 페이지의 콘텐츠를 처음 색인 할 때 날짜를 표시하는 방법을 찾았습니다. 더 명확하게 설명 할 수 있다고 생각하기 때문에 답변에 추가하고 있습니다.

  1. 결과적으로 원하는 페이지를 표시하는 것을 Google에서 검색하십시오.
  2. "검색 도구"사용
  3. "언제나"드롭 다운에서 "사용자 정의 범위 ..."를 선택하십시오.
  4. 1/1/1900에서 1/1/2020과 같은 큰 날짜 범위에 배치

그런 다음 Google은 검색 결과에서 페이지에있는 콘텐츠를 발견 한 날짜를 표시합니다.

첫 번째 색인

페이지가 새로운 콘텐츠로 업데이트되면 Google도이 날짜를 업데이트합니다. 따라서 "이 URL을 처음으로 색인화 한"날짜가 아니라 "이 컨텐츠를 처음으로 색인화 한"날짜에 가깝습니다.


페이지의 Google 캐시는 페이지의 마지막 색인 생성시기를 보여줍니다. Stack Exchange 홈페이지 가 오늘 마지막으로 색인 생성 되었음을 알 수 있습니다 .

여기에 이미지 설명을 입력하십시오


다른 옵션은 인터넷 아카이브의 Wayback 시스템을 사용하는 것 입니다 . 과거의 페이지 모습을 보여줍니다. 페이지가 처음 게시 된시기를 파악할 수 있습니다. Google과 인터넷 보관소 모두 페이지를 처음 게시 한 직후 크롤링하고 사용합니다.


1
첫 번째 옵션은 모든 URL에 대해 정확한 결과를 제공합니까? 설명대로 bing.com 을 검색 했지만의 색인 날짜가 처음이 아닙니다 bing.com. 내가 틀렸다면 미안해?
Sathiya Kumar

1
페이지의 내용이 변경되지 않는 한 정확한 것으로 보입니다. 페이지를 정밀 검사하면 Google에서이 날짜를 재설정 할 수 있습니다. 내부 페이지 는 2001 년 2 월 1 일로 표시 되어도 내 홈페이지 는 2002 년 2 월 1
일로 표시됩니다

@SathiyaKumar Bing.com 은이 방법을 사용하여 2014 년 3 월 19 일자 날짜를 알려줍니다 . 아무것도 그 노트를 수행 하지 분명히 구글에 의해 색인 (robots.txt를 통해 또는 기타)이 방법을 통해 표시되지 않습니다.
Thebluefish

4

가되지 않을 수 있을 확실히 내가 그렇게 할 수있는 방법을 알고하지 않습니다 - 임의의 웹 페이지가 처음 구글에 의해 색인 때 찾을 수있는 방법. 실제로 필요한 이유가 없기 때문에 Google이 단순히 해당 정보를 저장하지 않을 수도 있습니다. 또한이 정보를 저장하더라도 제 3 자에게 정보를 자유롭게 제공 할 특별한 이유가 없습니다.

(자신의 페이지이고 이전 웹 서버 액세스 로그에 액세스 할 수있는 경우 쉽습니다. Googlebot에서 해당 페이지로 처음 방문한 로그를 검색하기 만하면됩니다. 그렇지 않으면 확실하게 말할 방법이 없습니다.)


어쨌든 Zistoloen과 Stephen Ostermiller가 답변에 설명 한 방법은 일반적으로 Google이 특정 URL을 처음 색인화 한 날짜를 나타내지 않습니다 . 오히려 Google 은 URL의 콘텐츠가 게시되었거나 마지막으로 업데이트 된 것으로 생각 하는 날짜를 보여 주며 종종 페이지 콘텐츠 자체에서 날짜를 "스니핑"하려는 Google의 다소 안정적인 시도를 기반으로합니다.

에서 이 비디오 , 구글의 매트 컷츠는이 날짜가 선택하는 방법에 잠시 감동. 편의상 아래 비디오 관련 부분 (약 2 : 09 ~ 2 : 22)을 아래에 기록했습니다.

"... 종종 날짜를 볼 수 있습니다. 또는 날짜를 처음 보았을 때, 해당 페이지를 크롤링 할 때마다 또는 페이지에서 찾을 수 있으면 해당 날짜를 추출 할 수 있습니다. "스 니펫의 시작 부분에서 바로 볼 수 있습니다."

사이트를 실행하는 소프트웨어가 페이지 자체에 정확한 생성 / 수정 날짜를 자동으로보고하는 블로그 게시물, Wiki 페이지 또는 Stack Exchange 질문과 같은 페이지의 경우 Google에서보고 한 날짜가 일치 할 가능성이 있습니다. 그러나 다른 유형의 페이지의 경우 Google의 날짜 스니퍼가 더 열심히 작동해야하며 항상 제대로 작동하지는 않습니다 (이 맥락에서 "올바른"이 무엇이든간에).

특히이 날짜는 기본적으로 페이지의 색인이 생성 된 기간을 결정하는 데 쓸모가 없습니다 . 두 가지 이유가 있습니다.

  • 최근에 페이지가 수정되었고 수정 날짜가 페이지에 눈에 띄게 표시되는 경우 수정이 완전히 사소한 경우에도 Google은 해당 페이지를 "날짜"로 선택할 수 있습니다.

    예를 들어, 이 오래된 위키 페이지 ( 2003 년에 처음으로 기록 된 archive.org )는 현재 페이지 하단에 표시된 것처럼 가장 최근에 편집 된 날짜 인 2014 년 11 월 10 일부터 Google에 의해 날짜가 표시됩니다. 그날에 일어난 변화? 페이지 하단에서 단일 링크를 제거하기 만하면됩니다.

  • 반대로, 구글은 페이지에서 발견 된 아주 오래된 "발표일", 심지어 월드 와이드 웹 (World Wide Web)을 시작하기 이전 날짜조차 받아 들여서 기쁘다 .

    예를 들어, 이전 프로그래밍 콘테스트의이 페이지 는 Google에서 1986 년 9 월 15 일까지 실제로 날짜를 표시합니다 (실제로는 페이지에 설명 된 이벤트 날짜). 마찬가지로 1970 년에 학생 파업을 기록한이 페이지 는 Google이 1970 년 5 월 10 일 (페이지에서 스캔 한 문서 중 하나의 날짜)에 날짜를 기입했으며 , 이 Linux 매뉴얼 페이지 는 Google이 11 월 4 일에 날짜를 표시합니다. 1989 (페이지에서 사용 된 임의의 예시 날짜).

    Stephen과 Zistoloen이 설명하는 사용자 정의 날짜 범위 검색을 사용하지만 범위의 상단을 1991 년 8 월 6 일로 설정하면 더 많은 예제를 찾을 수 있습니다 .


그럼 당신의 대답에 당신은 주로 스티븐과 Zistoloen의 답변을 반대하지만 영업 이익의 질문에 대한 적절한 답변을 찾을 수 없습니다 "는 URL이 처음 구글에 의해 색인 때 내가 어떻게 찾을 수 있습니까?" 당신의 대답에 !!
Sathiya Kumar

"당신이 할 수 없다"또는 "아무도 방법을 모른다"라는 대답 이 없을 수도 있습니다 . 그러나 당신 말이 맞아요, 내 대답으로 편집하겠습니다.
Ilmari Karonen

OP의 실제 질문에 대한 답변을 편집하고 추가 한 @llmariKaronen +1
Sathiya Kumar
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.