내 사이트 맵 파일이 도움이된다는 명확한 지표가 있습니까?


73

최근에 sitemap.xml 파일을 만들어 Google 웹 마스터 도구 계정에 업로드했습니다 . Google은 내 사이트의 업로드 된 사이트 맵에 문제 나 오류를보고하지 않았습니다.

이제 내 질문은 :

  • 내 사이트 맵이 Google 웹 마스터 도구 내에서 작동하는지 어떻게 알 수 있습니까?

내가 묻는 이유는 내가 보거나 찾고 있다고 생각하는 것이 무엇인지 모르고 쓸모없는 파일을 업로드 한 것 같습니다.

답변:


93

사이트 맵 파일은 검색 엔진을하는 데 도움이 새롭게 업데이트 된 URL을 발견 당신의 웹 사이트에. 특히, 웹 사이트가 상당히 큰 경우, 모든 것이 맹목적으로 크롤링되어 변경 사항이 있는지 확인하지 않고 새로운 콘텐츠 및 업데이트 된 콘텐츠에 집중할 수 있습니다. 이로 인해 새로운 컨텐츠가 훨씬 빨리 발견 될 수 있으며, 특히 사이트가 더 크거나 복잡한 경우에 특히 눈에.니다.

특히 Google에서 (Google에서 일하고 다른 검색 엔진이 어떻게 처리하는지 모르겠습니다) 다음과 같은 작업을 수행합니다.

  • 웹 사이트의 색인 생성 된 URL 수 찾기 : 이 통계는 매일 다시 계산되며 매우 정확합니다. 이것들은 Sitemaps detail page 에서 찾을 수 있습니다 .
  • 표준화 문제 발견 : 숫자가 일치하지 않는 경우 Sitemap 파일에서 크롤링 중에 찾은 것과 일치하지 않는 URL을 지정한다는 의미입니다. 일반적으로 표준화 작업을 수행해야한다는 신호입니다 .
  • 표준화에 대한 도움말 : 사이트에서 동일한 콘텐츠를 표시하는 여러 개의 URL을 발견하면 다른 표준화 방법을 사용하지 않더라도 Sitemap에 나열된 URL에 추가적인 이점을 제공합니다.
  • 사이트의 색인이 잘못 지정된 부분 찾기 : 이 개수는 Sitemap 파일별로 제공되므로 사이트의 논리적 섹션에 대해 별도의 Sitemap 파일을 만들어 Google이 원하는만큼 색인을 생성하지 않는 영역을 찾을 수 있습니다.
  • 크롤링 오류 우선 순위 : 에서 크롤링 오류 섹션 , 사이트 맵 파일에 지정된 URL은 별도로 표시됩니다. 이러한 URL을 구체적으로 제공 했으므로 URL을 색인화하고 크롤링 오류가 중요하다고 가정합니다.

또한 Sitemaps 파일에 여러 가지 확장자 (예 : 이미지, 비디오, 뉴스 또는 국제화 등)를 사용할 수 있습니다. 이 확장은 모두 선택 사항입니다.

대부분의 웹 사이트에서 Sitemap 파일의 가장 눈에 띄는 요소는 색인이 생성 된 URL 수를 볼 수 있다는 것입니다. 사이트 맵이 표시 되려면 하루 정도 걸릴 수 있으므로 처음 Sitemap을 제출 한 경우 약간 인내심이 필요할 수 있습니다. 다른 방법 (예 : site : -query)은 매우 대략적인 근사치이지만이 수는 매우 정확합니다.

추가하기 위해 편집 : Sitemaps와 관련하여 개인적으로 매우 유용하다고 생각하는 또 다른 것은 CMS로 직접 생성하지 않으면 웹 사이트가 크롤링 가능한 방법과 발견되는 URL의 종류에 대해 항상 많이 발견한다는 것입니다 그 과정에서. 사이드 툴 (예 : Sitemaps 생성기)을 사용하여 웹 사이트를 크롤링하면 URL의 세션 ID, URL 차이를 통한 콘텐츠 복제, 무한 공간 (예 : 끝없는 캘린더) 또는 전혀 연결되지 않은 사이트의 일부로도 제공됩니다.


훌륭한 정보. 또한 트래픽이 많이 발생하는 사이트의 경우 트래픽이 많이 발생하는 사이트에서는 Google이 더 나은 작업 크롤링을 수행하고 사이트 맵에서 누락 된 항목이 있으면 색인 생성이 중단 될 수 있으므로 사이트 맵을 사용하지 않는 것이 좋습니다.
Chris_O

3
@Chris_O 서로 다른 문제를 해결하고 있습니다. 이 예에서 Google이 자체적으로 "더 나은"작업을 수행하고있는 것은 아닙니다. 사이트 맵 자체에 결함이 있습니다. "사이트 맵을 전혀 사용하지 마십시오"라는 직접적인 주장은 아닙니다. 이러한 상황에 대한 해결책은 사이트 맵을 수정하는 것입니다. 또한 사이트 맵은 지시문이 아니라 정보를 제공합니다. 사이트 맵에서 누락되었다고해서 Google에서 해당 사이트 맵을 찾지 않거나 무시하지는 않습니다.
Su '

문제의 사이트에 4 만 개 이상의 색인이 생성 된 페이지가 있고 새로운 콘텐츠는 5 분 이내에 색인을 생성합니다 (사이트 맵 없음). 귀하의 답변을 바탕으로 우리는 그것들을 구축하기 시작하고 몇 년으로 나눌 것입니다.
Chris_O

@ john-mueller 안녕 씨. 엠. -한 번 1000 개의 URL로 테스트 사이트 맵을 제출했는데 약 700 개의 색인 카운트를 되찾았습니다. 이제 www.complete.org/url/to/the/page.html 사이트를 통해 1000 개의 URL을 모두 테스트했습니다. 700 개 URL 이하의 카운트 방식 (200 개 지역에서 더 많음). 이것은 무엇을 의미 하는가?
프란츠

2
@Franz site : -queries를 사용하여 색인화 된 URL 수를 재현하기 어렵게하는 세부 사항이 가끔 있습니다. 예를 들어 여러 URL을 결합하여 site : -query에 대해 하나만 표시 할 수있는 상황이 있습니다. 따라서 차이점이 있다면 걱정할 가치가 없습니다.
존 뮬러

6

오류가 발생하지 않으면 Google이 파싱하여 내용을 알고 있다고 가정 할 수 있습니다. 그렇다고해서 해당 페이지를 크롤링하거나 색인을 생성한다는 의미는 아닙니다. 사이트 맵은 검색 엔진에 페이지 정보를 알려주는 또 다른 방법입니다. 이러한 페이지 중 일부 또는 전부를 크롤링하고 색인을 생성 할 의무는 없습니다. 링크 나 URL 제출을 통해 페이지를 찾는 경우에도 마찬가지입니다.


1
추가 된 정보로서 Google이 사이트 맵을 이해하는지 쉽게 알 수 있습니다. 최적화-> 사이트 맵에서 확인하십시오. 사이트 맵에 제출 된 URL 수를 알려줍니다. 사이트 맵이 성공적으로 내용을 읽었으며 그 안에 많은 링크가 있습니다. 두 번째 숫자는 색인이 생성 된 수이며 John이 지적한 바에 따라 가치가없는 콘텐츠, 일부 또는 대부분의 콘텐츠를 찾을 수 있는지 여부는 Google에 전적으로 달려 있습니다. 항상 제출 된 금액보다 적을 것입니다. Google은 일부 페이지가 뜨겁지 않은 것을 발견하고 방해하지 않습니다.
Fiasco Labs

1

양질의 링크가 많으면 Google은 일반적으로 웹 사이트 크롤링을 잘 수행합니다. 색인을 생성 한 페이지 수를 살펴 보는 데 많은 시간을 소비한다면 사이트를 개선하고 양질의 링크를 얻는 것이 좋습니다.


0

사이트 맵 유효성 검사 도구는 이런 식으로 사이트 맵이 시작되는 것을 본 적이 없습니다.


파일이 이미 검증되었습니다. 그것은 질문이 아닙니다.
Su '

0

수백, 수천 또는 수백만 페이지가있는 웹 사이트와 같은 더 큰 웹 사이트의 경우 매우 유용합니다. 회사 사이트에는 콘텐츠 ID로 URL이 동적으로 생성되고 URL 매개 변수가 &와 함께 사용 된 4 억 개의 페이지가 있으며 Google 웹 마스터 도구는 크롤링 된 페이지에 대한 피드백을 제공하고 오류를 표시하며 페이지를 디버깅하거나 열 수 있습니다. 무엇이 잘못되었는지 직접 확인하십시오. 이런 식으로 Google은 실제로 우리가 더 나은 웹 사이트를 만들도록 도와 주었고 몇 번이나 큰 난처함에서 벗어날 수있었습니다.

인덱싱 된 페이지 수와 크롤링 수를 보는 것도 유용합니다.

소규모 웹 사이트의 경우 웹 사이트가 각 페이지가 메뉴를 통해 링크되어 있고 사이트가 자주 업데이트되지 않는 작은 .html 페이지 그룹 인 경우 사이트 맵을 업로드하면 검색 결과에 아무런 변화가 없습니다. 사이트 맵을 업로드하지 않은 사람보다 사이트 맵을 업로드하면 이점이 없습니다.

나는 또한 약 20 개의 작은 웹 사이트를 가지고 있었는데 cron 스크립트에 의해 자동으로 생성 된 사이트 맵이 있었고 그 일을 중단했습니다. 어느 날 나는 실수로 XML 파일이 약 6 개월 동안 올바르게 생성되지 않는다는 것을 알았지 만 Google은 실수로 내 실수를 무시하고 사이트 맵에 오류가 있어도 이러한 웹 사이트를 완전히 색인화했으며 Google은 사이트 맵을 매우 진지하게.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.