Google 검색 결과에 XML 사이트 맵이 표시되지 않도록 방지


23

어떻게이의이 결과 같은 Google 검색 결과에 표시 내 XML 사이트 맵 파일을 방지 할 site:검색 쿼리 :

검색 결과의 사이트 맵

Google이 검색 결과에 사이트 맵 파일을 표시하기로 선택한 이유를 이해하지 못합니다. 이 파일은 사람이 사용할 수 없습니다.

Google은 크롤링하여 처리 할 수 ​​있어야하므로 robots.txt 에서 허용하지 않습니다 . 나는 그들이 처리 한 후 검색 결과에 넣기를 원하지 않습니다.


1
허. 흥미 롭군 내가 가진 유일한 생각은 사이트에 링크가 있거나 사이트 맵 파일에 나타나는 경우입니다. 또한 이것이 robots.txt 파일에서 참조하는지 확실하지 않습니다. 나는 그렇게 생각하지 않을 것입니다. Google WMT를 통해서만 내 사이트 맵을 제공하지만이 문제는 아직 보지 못했습니다. 사이트 맵을 공개하고 싶지 않다는 것을 이해할 수 있습니다. 나는 내 공개를 원하지 않습니다. 너무 많은 해커 / 스크레이퍼가 있습니다.
closetnoc

3
이 특정 사이트 /sitemap.xml에서 robots.txt에 나열된 다음 /sitemap-123.xml및과 같은 다른 사이트 맵으로 연결됩니다 /sitemap-124.xml. 매일 사이트 맵을 재생성하고 숫자가 매일 바뀝니다. 색인이 생성 된 것은 상당히 오래된 것입니다. 내 사이트의 아무 곳이나 링크하지 않지만 다른 사이트에는 링크가있을 수 있습니다.
Stephen Ostermiller

1
사용하지 않는 경우 삭제되었는지 확인한 후 robots.txt 파일에서 제외하면 SERP에서 상당히 빨리 삭제됩니다. 이상하게도 robots.txt가 상당히 빠르지 만 Google WMT에서 URL을 제거하는 데 시간이 오래 걸립니다.
closetnoc

1
XML 사이트 맵 을 GWMT 계정에 제출 했습니까 ?
Oleg

3
사이트 맵 파일은 오늘까지도 존재했습니다. 나는 그것을 제거에 지금은 리디렉션 /sitemap.xml 내가이 특정 사이트 맵 이제 인덱스 밖으로 떨어질 것으로 가정합니다. 앞으로도 Google이 사용자를 검색하도록 표시하지 못하게하고 싶습니다.
Stephen Ostermiller

답변:


18

Google은 XML 사이트 맵 (예 : XML 파일)을 색인합니다. Google이 URL을 알고 있고 올바른 응답을 반환하면 Google의 포함 규칙을 통과하여 색인을 생성 할 수 있습니다. 개인적으로, 나는 GWT를 통해서만 사이트 맵을 제출하고 Sitemap:robots.txt에 참조를 포함하며 이것이 색인을 생성하기에 충분합니다.

Google에서 이러한 파일을 색인 생성하지 못하게하는 권장 방법 X-Robots-Tag은 XML 사이트 맵을 제공 할 때 HTTP 응답 헤더 를 포함하는 것 입니다. 예를 들면 다음과 같습니다.

X-Robots-Tag: noindex

HTML 파일에 로봇 META 태그를 포함하는 것처럼 X-Robots-Tag헤더는 모든 유형의 파일에 사용할 수 있습니다.

참조 : 이 문서 (2008 년 11 월부터!) 는 XML 사이트 맵을 처리 할 때 응답 사용과 관련하여 Google 의 John Mueller (Google) 를 인용 한 것으로 보입니다 X-Robots-Tag.
예, Google은 XML Sitemap 파일의 색인을 생성하고 순위를 매 깁니다.

자세한 내용은 Google 개발자 안내서 :
로봇 메타 태그 및 X-Robots-Tag HTTP 헤더 사양을 참조하십시오.


X-Robots-Tag: noindex헤더 코드 는 어디에 작성해야 합니까? 내부 sitemap.xml또는 robots.txt?
xameeramir

1
@student HTTP 응답 헤더 이므로 파일을 제공 하기 전에 설정해야 합니다 (HTTP 응답 헤더의 일부로). "내부"로 설정할 수 없습니다. 이러한 파일을 제공하는 방법에 따라 서버 측 코드 (예 : PHP header('X-Robots-Tag: noindex',true)) 또는 Apache를 사용하는 경우 .htaccess 파일 또는 서버 구성 에서이를 설정할 수 있습니다 . 예제 코드는 Stephen의 답변 을 참조하십시오 . 위의 링크 된 Google 개발자 안내서도 참조하십시오.
MrWhite

8

X-Robots-Tag 사용에 대한 MrWhite의 답변이 올바른 방법으로 보입니다.

다음은 .htaccess 또는 Apache 구성 파일 에서 사용할 수있는 코드입니다 . (참고 : WebmasterWorld-SERP에 표시되는 사이트 맵-이것을 방지하는 방법? )

<Files ~ "sitemap.*\.xml(\.gz)?$">
  Header append X-Robots-Tag "noindex"
</Files>

아래 의 nginx 구성과 다음이 될 것입니다. (참고 : Yoast X-Robots-Tag 예제 )

location ~* sitemap.*\.xml(\.gz)?$ {
    add_header X-Robots-Tag "noindex";
}

2

왜 중요한가요?

실제로 SERP에서 사이트 맵을 찾을 수 있다면 더 큰 문제가 있습니다.

대신 유용한 콘텐츠로 페이지를 올리는 데 더 집중할 것입니다. 그렇게하면 사이트 맵을 찾는 데 어려움을 겪을 수 있습니다. 어쨌든 그 시점에서 신경 쓰지 않을 것입니다.

추신

거의 모든 사람이 사이트 맵을 같은 장소에 유지합니다. 그래서 누군가가 당신이 그것을 지키는 곳을 찾으려면 :)


4
사이트 검색에 Google을 사용하고 사이트 맵을 사용할 때 넘어졌습니다. 사용자가 클릭하면 혼란 스러울 수 있습니다.
Stephen Ostermiller

사이트 검색에 Google을 사용하는 사용자는 몇 명입니까?
dasickle

3
검색어를 입력 한 모든 사용자가 내 페이지 상단의 검색 창에 입력됩니다.
Stephen Ostermiller

이 경우 사이트 검색에 swiftype.com 과 같은 것을 사용하는 것을 고려 했습니까 ? 당신이 사용할 수있는 다른 사람의 상단이 있습니다. 결과를 재주문, 제거 및 추가 할 수 있습니다. 당신은 또한 훌륭한 통계 등을 얻을
dasickle

-6

robots.txt에 다음을 입력하십시오.

User-agent: *
Disallow: /sitemap.xml

대신 Google 웹 마스터 도구를 통해 사이트 맵을 제출하십시오.


1
논리를 명확하게 설명해 주시겠습니까? 첫 번째 문장이 마지막 문장과 충돌하는 것 같습니다.
MrWhite

5
Google은 여전히 ​​robots.txt에서 차단 된 사이트 맵을 크롤링합니까? 어설 션을 지원하기위한 참조가 있습니까?
Stephen Ostermiller

4
sitemap.xml을 허용하지 않으면 더 이상 크롤링되지 않을 것입니다. 당신이하고 싶은 일이 아닙니다!
Max

2
Google은 robots.txt가 허용되지 않은 문서를 크롤링하지 않습니다. 어쨌든 사이트 맵이 포함되어 있습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.