Google 미리보기는 Robots.txt를 준수합니까?


11

그것이 마치 겉 모습처럼 보이기 때문입니다. 내 사이트의 경우 이미지 디렉토리를 허용하지 않으며 미리보기에는 이미지가 모두 누락되어 사이트가 엉뚱 해 보입니다.

이 경우이며 미리보기 봇만 robots.txt를 사용하여 이미지에 액세스 할 수있는 방법이 있습니까?

편집 : 미리보기는 일반 Google Bot과 웹 마스터 센터 블로그 에서 언급 한 것처럼 즉시 봇 Google Web Preview에 의해 생성 된 것처럼 보입니다 .

사이트 : 검색 및 모니터링 소프트웨어를 사용하면 봇이 내 사이트를 방문했을 때와이 상황이 발생했을 때 미리보기에서 이미지가 제대로 표시됩니다. 따라서 일반 크롤러는 robots.txt 당 이미지를 무시하지만 미리보기 크롤러는 이미지를 가져옵니다.

내 옵션은 다음과 같이 보이기 때문에이 구현은 일종의 무례한 것처럼 보입니다.

  1. Google 봇이 내 이미지를 크롤링하도록 허용 (원치 않는)
  2. 미리보기를 차단하는 nosnippet 태그를 사용하지만 ALSO 스 니펫 (원치 않는)
  3. 클릭 연결에 부정적인 영향을 줄 수있는 이상한 미리보기를 표시합니다.

이미지의 색인이 생성되지 않은 경우 크롤링을 허용하지만 "noindex"가있는 x-robots-tag HTTP 헤더를 사용하여 이미지를 제공 할 수 있습니다.
John Mueller

@ 존 뮬러 이것은 대답처럼 보인다. 답변 섹션에 게시하지 않으시겠습니까?
plntxt

답변:


3

나는 존 뮬러가 의견에서 옳았다 고 생각합니다.

이미지의 색인이 생성되지 않은 경우 크롤링을 허용하고 "noindex"가있는 x-robots-tag HTTP 헤더로 이미지를 제공 할 수 있습니다.

Google이 색인을 생성하지 않고 콘텐츠를 크롤링하도록 허용 할 수 있다는 것을 몰랐습니다. 나는 그의 기술을 제자리에 놓고 그것이 작동하는지 확인하기 위해 크롤링되기를 기다리고 있습니다.

John이 답을 얻을 수 있도록 답변 섹션에 자신의 의견을 추가하지 않는 한 며칠 안에이 답변을 수락합니다.


댓글 답변에 대해 죄송합니다 :). 명심해야 할 것은이 과정이 현재 그렇게 빠르지는 않다는 것입니다. 이미지의 색인 상태를 변경하는 것은 일반적으로 웹 검색보다 느리고 미리보기 이미지를 업데이트하면 일반 웹 검색 콘텐츠 (캐시 된 페이지, 제목, 스 니펫)를 업데이트하는 것보다 훨씬 오래 걸릴 수 있습니다. 실제로, 나는 이것이 당신이 어떤 변화를 보는 데 몇 주가 걸릴 것이라고 생각합니다. 따라서 인내심을 가지십시오 :).
John Mueller

인내심이 핵심입니다. 변경 후 몇 주 후에 일부 이미지가 표시되지만 여전히 누락되었습니다. 그러나 이것은 내 문제에 대한 해결책 인 것처럼 보입니다.
plntxt

2

미리보기의 대부분은 Google 봇 크롤러가 수행하므로 사이트 일부의 크롤링을 차단하면 미리보기에 영향을 미칩니다.

Google 봇이 이미지를 크롤링하도록 허용하고 싶지 않은 이유는 무엇입니까?


2
제품 사진에 투자하는 데 상당한 시간과 비용이 소요되며 이미지 검색을 사용하는 사람들은 일반적으로 이미지를 검색하고 제품을 구매하지 않기 때문에 이미지를 이미지 검색에서 제외하는 것을 선호합니다. 우리의 이미지가 색인에 있다면 경쟁 업체가 이미지를 훔치기가 더 쉬워 질 것입니다.
plntxt

1
당신은 당신의 사진 및 / 또는 스테가 노 그라피 내부에 저작권 및 / 또는 필터 표시를 참조하여 워터 마크를 시도 할 수 있습니다 ...
파스칼 Qyy

1
@지. Qyy 또는 저작권이있는 이미지를 웹에서 스캔하기 위해 무한한 원숭이를 지불 할 수 있습니다.
plntxt

@Jim : 또는 당신은 종이에 사진을 소중히 간직 할 수 있고 절대로 인터넷에 두지 마십시오 ... ^^
Pascal Qyy

1
좋은 점-사진을 완벽하게 보호 할 수있는 것은 없지만 Google 색인에 포함시키지 않는 것이 좋습니다. 나는 워터 마킹 팬이 아니며 이미지를 다른 곳에서 줄이는 가장 비용 효율적인 방법은 이미지를 색인에서 제외시키는 것입니다.
plntxt

2

다음은 단순히 귀하의 사이트에 적용 할 수도 있고 아닐 수도있는 기술 솔루션입니다.

메타 데이터 또는 robots.txt에 몇 가지 힌트만으로 Google 이이를 수행 할 수있는 방법을 Google에서 제공 할 수도 있지만 그때까지는 ....


1 단계.

첫 페이지 이미지에 대한 리디렉션 서비스 / 서블릿을 만듭니다.

즉 같은 URL

/frontpageimages/[image name]

것으로는 않습니다 서버 측 에 리디렉션을

/images/[image name]

2 단계.

첫 페이지 (및 첫 페이지 만)의 모든 이미지 링크를 다시 작성하여 이미지에 직접 연결하지 않고 1 단계부터 리디렉션 서비스를 거치도록하십시오.

3 단계.

robots.txt에서 googlebot이 크롤링 할 수 있는지 확인 /frontpageimages/


이를 통해 Google은 첫 페이지에서 발생한 이미지를 크롤링하면서 다른 페이지의 이미지는 그대로 남겨 둘 수 있습니다.

리디렉션 서비스는 이론적으로 robots.txt 를 기술적으로 위반 하지 않고 모든 이미지를 크롤링하는 데 사용될 수 있지만, Googlebot과 같은 잘 동작하는 로봇이하는 일은 아닙니다. 그리고 동작이 잘못된 로봇은 robots.txt에 대해 걱정하지 않습니다.


첫 페이지 만 미리보기를 표시하려는 사람은 누구입니까? 모든 페이지를 좋은 미리보기로 표시하고 싶습니다. 모든 페이지에 대해이 작업을 수행하면 처음에는 이미지를 차단하는 목적을 부정하게됩니다.
John Conde

@ 존 당신이 맞아요. 이 경우 Google에서 색인을 생성하길 원하거나 그렇지 않습니다.
Kris
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.