사이트 맵 역설


249

우리는 스택 오버플로에서 사이트 맵 을 사용 하지만 그것에 대해 여러 가지 감정이 있습니다.

웹 크롤러는 일반적으로 사이트 내 링크와 다른 사이트에서 페이지를 검색합니다. Sitemap은 Sitemap을 지원하는 크롤러가 Sitemap의 모든 URL을 선택하고 관련 메타 데이터를 사용하여 해당 URL에 대해 배울 수 있도록이 데이터를 보완합니다. Sitemap 프로토콜을 사용 한다고해서 웹 페이지가 검색 엔진에 포함되는 것은 아니지만 웹 크롤러가 사이트를 더 잘 크롤링하는 데 도움이되는 힌트를 제공합니다.

2 년 간의 사이트 맵 경험을 바탕으로 사이트 맵에 대해 근본적으로 역설적 인 내용이 있습니다 .

  1. 사이트 맵은 제대로 크롤링하기 어려운 사이트를위한 것입니다.
  2. Google에서 링크를 찾기 위해 사이트를 크롤링 할 수 없지만 사이트 맵에서 찾을 수있는 경우 사이트 맵 링크에 가중치가없고 색인을 생성하지 않습니다!

이것이 사이트 맵 역설 입니다. 어떤 이유로 든 사이트가 제대로 크롤링되지 않는 경우 사이트 맵을 사용해도 도움이되지 않습니다!

Google은 사이트 맵을 보장하지 않습니다 .

"우리는 약 또는 URL이 크롤링되거나 색인에 추가 될지 여부에 대해 어떤 예측이나 보장 할 수 없습니다" 인용을

"Google은 모든 URL을 크롤링하거나 색인 생성한다고 보장하지 않습니다. 예를 들어 Sitemap에 포함 된 이미지 URL은 크롤링하거나 색인 생성하지 않습니다." 소환

"귀하의 사이트의 모든 페이지가 검색 결과에 크롤링되거나 포함되는 것을 보장하지 않는 사이트 맵을 제출" 인용

사이트 맵에있는 링크는 추천 일 뿐이지 만 , 자신의 웹 사이트에있는 링크는 정식으로 간주됩니다 . 사이트 맵을 피하고 Google과 다른 검색 엔진이 제대로 작동 할 수 있는지 확인하는 것이 논리적으로 보이는 것 같습니다 다른 사람들이 보는 평범한 표준 웹 페이지를 사용하여 사이트를 스파이더하십시오.

그 때까지는 작업이 완료 한 것을 , 좋은 스파이더지고 철저하게 Google은 것을 볼 수 있도록 자신의 사이트의 페이지에 대한 링크 및 링크를 크롤링 할 의향이 - 어, 왜 우리는 다시, 사이트 맵을 필요합니까? 사이트 맵은 검색 엔진 스파이더가 전체 사이트를 성공적으로 크롤링 할 수 없도록 방해하기 때문에 적극적으로 유해 할 수 있습니다. "아, 크롤러가 볼 수 있는지 여부는 중요하지 않습니다. 사이트 맵에서 해당 링크를 때리기 만하면됩니다!" 현실은 우리의 경험과는 정반대입니다.

사이트 맵은 링크가 매우 깊거나 스파이더하기 어려운 복잡한 UI가있는 사이트를 대상 으로 한 입니다. Google은 사이트 맵이 도움이되지 않습니다. Google에서 사이트의 링크를 제대로 찾지 못하면 사이트 맵에서 색인을 생성하지 않기 때문입니다. 우리는 스택 오버플로 질문과 함께이 입증 된 시간과 시간을 다시 보았습니다.

내가 잘못? 사이트 맵이 이해가 되나요? 어쨌든 잘못 사용하고 있습니까?


사이트 맵이 더 단순한 시대에 더 단순한 도구라고 생각했습니다. 요즘 사이트 맵을 제공하는 유일한 이유는 기술적으로 경 사진 사람이더라도 사이트 탐색에 대한 인간의 도움이 필요하다는 것을 알았습니다. "어떤 이유로 든 사이트가 제대로 크롤링되지 않으면 사이트 맵을 사용해도 도움이되지 않습니다!"라는 문제가 표시되지 않습니다. 그러나 그것은 단지 나일지도 모른다.
jcolebrand 23시 47 분

3
Google에서 대량의 트래픽을 생성하는 것으로 알고 있습니다. 다른 스파이더가 사이트 맵을 어떻게 사용하는지 이해하는 것이 중요하다고 생각합니다.
MikeJ

22
구글은 우리의 트래픽의 "일괄"아니다 @mikej, 모든 검색 트래픽의 99.6 %와 전체 트래픽의 87 %입니다
제프 앳 우드

2
Jeff, 항상 귀하의 게시물을 좋아합니다 ... Google이 달리 찾을 수없는 페이지에 대해서만 XML 사이트 맵을 사용합니다. 그러나 실제로 나는 그들과 구글 웹 마스터 도구로 dissapointed되었습니다. 솔직히 말해서 Google은 사이트에서 사용 가능한 콘텐츠를 충분히 색인화합니다. 사이트 맵을 가리킬 필요가 없습니다. 이제 사용자 탐색을위한 사이트 맵은 현명한 아이디어입니다. 나는 Web.2.0 바닥 글 사이트 맵을 좋아하고 그것들을 거의 모든 디자인에 통합하려고 노력합니다.
Frank

1
@Jeff Atwood : John Mueller는 "우리는 연결되지 않은 URL을 선택하고 색인을 생성합니다"라고 역설을 해결합니까?
Rob Olmos

답변:


192

면책 조항 : Google의 Sitemap 팀과 협력하여 다소 편견이 있습니다 :-).

"웹 색인이 아닌"콘텐츠 (이미지, 비디오, 뉴스 등)에 Sitemap을 광범위하게 사용하는 것 외에도 다음과 같은 주요 목적으로 Sitemaps 파일에 포함 된 URL의 정보를 사용합니다.

  • 새롭고 업데이트 된 컨텐츠 발견
  • 표준화를 위해 선호하는 URL 인식 ( 표준화를 처리 하는 다른 방법 도 있음)
  • Google 웹 마스터 도구에서 유용한 색인화 된 URL 수 제공 (사이트에서 근사 : 검색어는 통계로 사용할 수 없음)
  • 유용한 크롤링 오류에 대한 근거 제공 (Sitemap 파일에 포함 된 URL에 크롤링 오류가있는 경우 일반적으로 더 큰 문제이며 웹 마스터 도구에 별도로 표시됨)

웹 마스터 측에서 Sitemap 파일도 매우 유용하다는 것을 알았습니다.

  • 크롤러를 사용하여 Sitemaps 파일을 만드는 경우 사이트가 크롤링 가능한지 쉽게 확인하고 어떤 종류의 URL이 있는지 직접 확인할 수 있습니다. 크롤러가 선호하는 URL을 찾거나 잘못 구성 되었습니까? 크롤러가 무한한 공간 (예 : 끝없는 캘린더 스크립트)에 갇혀 있습니까? 서버가로드를 처리 할 수 ​​있습니까?
  • 귀하의 사이트에는 실제로 몇 개의 페이지가 있습니까? Sitemap 파일이 "깨끗한"경우 (복제본 없음 등) 쉽게 확인할 수 있습니다.
  • 콘텐츠가 중복되지 않고 사이트를 실제로 크롤링 할 수 있습니까? Googlebot이 남긴 서버 로그와 Sitemaps 파일을 비교합니다. Googlebot이 Sitemap 파일에없는 URL을 크롤링하는 경우 내부 연결을 다시 확인해야 할 수 있습니다.
  • 서버가 선호하는 URL에 문제가 있습니까? Sitemaps URL로 서버 오류 로그를 교차 확인하면 매우 유용 할 수 있습니다.
  • 실제로 색인이 생성 된 페이지 수는 몇 개입니까? 위에서 언급했듯이이 수는 웹 마스터 도구에서 볼 수 있습니다.

사이트가 크롤링되고 색인이 생성되면 Google의 관점에서 볼 때 매우 작고 정적이며 쉽게 크롤링 가능한 사이트의 경우 Sitemap을 사용하는 것이 불필요 할 수 있습니다. 다른 것에는 실제로 사용하는 것이 좋습니다.

FWIW 내가 다룰 몇 가지 오해가 있습니다.

  • Sitemap 파일은 크롤링 문제를 "수정"하기위한 것이 아닙니다. 사이트를 크롤링 할 수 없으면 먼저 수정하십시오 .
  • 순위에 Sitemap 파일을 사용하지 않습니다.
  • Sitemap 파일을 사용해도 사이트 크롤링이 줄어들지는 않습니다. 추가 정보이며 크롤링을 대체하지 않습니다. 마찬가지로 Sitemap 파일에 URL이 없다고해서 색인이 생성되지는 않습니다.
  • 메타 데이터를 망설이지 마십시오. 유용한 값을 제공 할 수없는 경우 (예 : 우선 순위 등) 그대로두고 걱정하지 마십시오.

"자체 순위"에 Sitemap을 사용하십니까? 한 사이트에서 콘텐츠 순위를 결정하는 것을 의미합니다. 그렇지 않으면 왜 priority필드입니까?
DisgruntledGoat

7
'우선 순위'요소는 사이트에 크롤링이 매우 제한되어있는 경우 사용할 수있는 아주 작은 신호입니다 (순위 목적으로는 사용하지 않음). 대부분의 사이트에서 이는 문제가되지 않으므로 유용한 값을 쉽게 제공 할 수 있지만 불가능한 경우 잠을 잃을 수있는 것은 아닙니다. 이 메타 데이터 요소와 다른 메타 데이터 요소에 유용한 값을 제공 할 수없는 경우 요소를 모두 그대로 두십시오 ( "기본"값을 사용하지 마십시오).
John Mueller

이 유익한 답변에 감사드립니다. 사이트 맵 업데이트를 중단하고 RSS 피드를 지금부터 사이트 맵으로 사용하겠습니다.
Stephan Muller

1
정보가 100 개 수준 인 "크롤링 문제"가 있습니까? 예를 들어, 웹 스토어가 있고 카테고리에 긴 제품 목록 (예 : 3000 제품)이있는 경우입니다. 목록은 페이징되어 있으며 200 페이지가 있습니다. 당연히 모든 링크를 표시하지는 않습니다. 더 좋아 1 2 3 ... 22 **23** 24 ... 198 199 200. 따라서 100 페이지의 제품을 찾으려면 약 100 개의 링크를 거쳐야합니다. 또는 검색 창을 사용하십시오. Googlebot이 크롤링합니까, 아니면 약 20여 레벨 후에 포기합니까? 여기에 사이트 맵이 적합한 솔루션입니까?
Vilx-

1
@Martijn-알겠습니다. 그러나 "Next"를 200 번 클릭하여 모두 보려면 어떻게해야합니까? 거미가 부지런히 딸깍 소리를 내거나 약 30 후에 포기하고 "이 젠장, 난 링크 체인을 따르지 않는다"고 말할까요?
Vilx-

40

사이트 아키텍처가 양호하고 Google에서 자연스럽게 페이지를 찾을 수 있다는 사실을 알고 있다면 사이트 색인 생성 속도가 빠르면 색인 생성 속도가 빨라진다는 것입니다.

다음은 신사가 Google이 사이트 맵을 사용하거나 사용하지 않고 사이트를 크롤링하는 속도를 테스트 한 2009 년 기사입니다. http://www.seomoz.org/blog/do-sitemaps-effect-crawlers

내 경험에 비추어 볼 때 새롭고 테스트되지 않은 것을 시작하는 경우 Google이 사이트를 크롤링하여 수정해야 할 항목이 없는지 확인하고 제출하지 마십시오. Google에서 더 빨리보고 제출하거나 뉴스 속보와 같은 다른 시간에 민감한 정보가있는 경우 Google이 처음 보는 사람이되도록하기 위해 할 수있는 모든 일을하고 싶기 때문에 제출하십시오. 그렇지 않으면 환경 설정의 문제입니다.


RSS 피드가 같은 것을 달성하지 않습니까?
Virtuosi Media

인덱싱을 개선하기 위해 RSS 피드로 할 수있는 일이 많이 있지만, 위에 링크 된 기사의 데이터는 RSS 피드보다 사이트 맵이 더 효과적이라는 것을 보여줍니다.
Joshak

15

Google의 경우 가장 빠른 방법으로 업데이트를 추적하려면 사이트 맵이 필요합니다. 예를 들어, 웹 사이트의 특정 위치에 새로운 콘텐츠를 추가했다고 가정 해 봅시다. 홈페이지에서 도달하려면 10-20 회 이상 클릭해야합니다. Google이 짧은 시간 내에이 새로운 페이지에 도달 할 가능성은 줄어들 것입니다. 대신이 페이지의 경로가 완전히 결정될 때까지 해당 페이지의 존재 가 발표됩니다. 결국 PageRank는 즉시 계산되지 않으므로 사용자 행동 등을 평가하는 데 시간이 걸리므로 그때까지 엔진이 새로운 콘텐츠로 페이지를 크롤링하고 색인을 생성하지 않아야하는 이유는 무엇입니까?


4
stackoverflow와 같은 사이트는 너무 자주 크롤링되므로 사이트 맵을 사용하는 것보다 더 빠릅니다 .
John Conde

3
@ john 여전히, 이것은 사이트 맵이 실제로 당신을 위해 무엇을 할 수 있는지 생각할 수있는 유일한 합리적인 설명입니다. "다치게 할 수 없다"는 일반적인 자제이지만 사이트 맵이 존재 하는 것만으로 도 해 롭습니다 (추가 복잡성 등).
Jeff Atwood

@Jeff 나는 동의하지 않았다. 나는 단지 그 금형에 맞지 않는다고 말하고있었습니다.
John Conde

2
이은 이러한 종류의 Joshak 제공된 링크를 통해 확인 seomoz.org/blog/do-sitemaps-effect-crawlers
제프 앳 우드

@Jeff Atwood "@John still, ..."그것이 제가 시도하려는 요점입니다. 처음에는 유익했지만 지금은 필요하지 않습니다. 그렇다면 왜 계속 노력하고 있습니까?
jcolebrand

9

사이트 맵을 올바르게 사용하면 매우 유용합니다.

우선, 구글이 힌트라고 말한다는 사실은 a) 웹 마스터가 사이트 맵 = 색인 생성이라는 잘못된 인상을받지 않도록해야하며 b) 신뢰할 수 없다고 판단 될 경우 특정 사이트 맵을 무시할 수있는 능력을 Google에 제공합니다 ( 일명 lastmod는 매일 액세스하는 모든 URL의 현재 날짜입니다.)

그러나 Google은 일반적으로 사이트 맵을 좋아하고 소비합니다 (실제로 사이트 맵을 찾아 Google 웹 마스터 도구에 추가하기도 함). 왜? 크롤링 효율을 높입니다.

시드 사이트에서 시작하여 웹을 크롤링하는 대신 제출 된 사이트 맵을 기반으로 적절한 양의 크롤링 예산을 사이트에 할당 할 수 있습니다. 또한 관련 오류 데이터 (500, 404 등)로 사이트의 많은 역사를 구축 할 수 있습니다

Google에서 :

"Googlebot은 한 페이지에서 다른 페이지로 연결되는 링크를 따라 웹을 크롤링하므로 사이트가 제대로 연결되지 않으면 검색하기가 어려울 수 있습니다."

그들이 말하지 않는 것은 웹 크롤링에 많은 시간이 걸리고 치트 시트 (일명 사이트 맵)를 선호한다는 것입니다.

물론, 크롤링 관점에서 사이트는 문제가 없지만 새로운 콘텐츠를 도입하려는 경우 우선 순위가 높은 사이트 맵에 해당 콘텐츠를 삭제하는 것이 더 빨리 크롤링되고 색인을 생성하는 방법입니다.

또한 새로운 콘텐츠를 빠르게 찾고 크롤링하고 색인을 생성하기 때문에 Google에서도 작동합니다. 이제 정글 접근 방식에서 Google이 치열한 경로와 만도를 선호하지 않는다고 생각하더라도 사이트 맵이 중요한 이유는 추적입니다.

특히, 사이트 맵 색인 (http://sitemaps.org/protocol.php#index)을 사용하면 사이트 맵을 사이트 맵별 사이트 맵 섹션으로 분류 할 수 있습니다. 이렇게하면 사이트 섹션의 색인 생성 비율을 섹션별로 볼 수 있습니다.

한 섹션 또는 콘텐츠 유형은 87 % 색인 생성율을 가질 수있는 반면, 다른 섹션 또는 콘텐츠 유형은 46 % 색인 생성률을 가질 수 있습니다. 그 이유를 알아내는 것이 당신의 일입니다.

사이트 맵을 최대한 활용하려면 웹 로그를 통해 사이트에서 Googlebot (및 Bingbot) 크롤링을 추적하고이를 사이트 맵과 일치시킨 후 추적하여 트래픽을 추적해야합니다.

사이트 맵에서 잠을 자지 말고 투자하십시오.


2
동의하지 않습니다. 사이트 맵은 한 번 목적이 있었으며 이제는 제 솔직한 의견으로는 쓸모가 없습니다. 사이트를 크롤링 할 수 있으면 RSS를 사용하여 해당 링크를 찾을 수 있습니다. 소셜 미디어는 Google이 페이지를 더 빨리 찾고 색인을 생성하는 좋은 방법입니다.
Simon Hayter

8

구글의 말에 따르면 : "대부분의 경우 웹 마스터는 Sitemap 제출의 혜택을 누리게되며 어떠한 경우에도 처벌을받지 않습니다."

그러나 귀하의 웹 사이트 페이지를 검색 엔진에 표시하려면 사이트에서 적절한 크롤링이 가능한지 확인하는 것이 가장 좋습니다.


5
귀하의 웹 사이트 크롤링 상태와 상관없이 링크가 색인되도록 보장되는 "안전성"과 같이 여전히 정신적 비용이 있습니다. 이는 당사의 경험에 해당되지 않습니다.
Jeff Atwood

7

검색 엔진은 사이트 맵을 사용하여 페이지를 찾는 것이 아니라 업데이트를 확인하는 빈도를 최적화한다고 생각합니다. 그들은보고 <changefreq><lastmod>. 구글은 아마도 전체 웹 사이트를 매우 자주 스파이더하지만 (로그를 확인하십시오!) 모든 검색 엔진이 그렇게 할 수있는 리소스를 가지고 있지는 않습니다 (누구나 Blekko를 사용해 보셨습니까 ?). 어쨌든 사용에 대한 페널티가 없으므로 자동으로 쉽게 만들 수 있으므로 계속하고 싶습니다.


4
나는 <priority>어떤 페이지가 가장 중요한지를 알리기 위해이 분야가 상당히 중요 하다고 생각합니다 . 예를 들어 스택 오버플로에는 수백 개의 태그 및 사용자 페이지가 있지만 질문 자체만큼 중요하지는 않습니다. 사이트 맵에서 질문 우선 순위를 1로 설정하고 그 밖의 모든 것을 낮추면 질문이 다른 페이지보다 색인화 될 가능성이 높습니다.
DisgruntledGoat

6

이 주제에 대해 관심이 있으시면이 훌륭한 Google 논문 http://googlewebmastercentral.blogspot.com/2009/04/research-study-of-sitemaps.html (2009 년 4 월)을 읽어보십시오-블로그 게시물뿐만 아니라 전체 논문을 읽으십시오 .

종이에서

  • 좋아, 기본적으로 구글은 같은 질문으로 고심했다.
  • 사이트 맵 내에서 가치를 결정하는 방법은 공개하지 않지만 시작 페이지에서 사이트 맵으로 가상 링크의 개념을 언급합니다.
  • 다른 흥미로운 것들이 많이 있습니다

그러나 사이트 맵은 주로 가치 결정이 아닌 검색 (Google이 물건을 검색하는 과정)에 사용됩니다. 검색에 어려움이 있으면 사이트 맵을 사용하십시오. 검색은 크롤링의 전제 조건이지만 값 결정에는 영향을주지 않습니다.

내 경험에서

  • 페이지를 서로 연결하기 위해 HTML 및 XML 사이트 맵을 사용하는 사이트가 많이 있습니다.
  • 이 중 XML 사이트 맵은 HTML 사이트 맵보다 훨씬 잘 크롤링됩니다. (나는 정말 큰 것을 정말 잘 보았습니다)
  • XML 사이트 맵을 사용하는 매우 성공적인 사이트도 있습니다.

50 만 페이지가 넘는 사이트에 SEO 전략을 구현할 때

  • 방문 페이지
  • sitemap.xml
  • 시작 페이지

다른 모든 것들은 "밸러스트"입니다. 예, 다른 것들은 긍정적 인 SEO 가치를 가질 수 있지만 확실히 음의 가치를 가지고 있습니다 : 그것은 사이트를 관리하기 어렵게 만듭니다. (ps : 가치 결정을 위해 방문 페이지를 감각적 인 방식 (큰 영향)으로 연결하지만 이미 두 번째 단계입니다).

귀하의 질문에 대해 : 발견, 크롤링, 색인 및 순위를 혼동하지 마십시오. 모든 항목을 개별적으로 추적 할 수 있으며 모든 항목을 개별적으로 최적화 할 수 있습니다. 또한 대규모 (예 : 실시간) 사이트 맵을 사용하여 검색 및 크롤링 기능을 향상시킬 수 있습니다.


5

사이트 맵은 엉덩이를 저장할 수 있습니다.

내 사이트 중 하나에 검색 엔진이 스파이더 링되는 것을 방지하는 많은 링크가 있습니다. 간단히 말해 Google은 내 포럼에서 JS를 잘못 해석하고 500 및 403 개의 응답 코드를 트리거하여 사이트의 위치에 영향을 미쳤다고 생각했습니다. robots.txt를 통해 문제가있는 URL을 제외하여이 문제를 해결했습니다.

어느 날, 나는 엉망이되어 Google에서 해당 사이트의 일부 페이지를 크롤링하지 못하도록 막고 싶었습니다. 포럼 제외로 인해 "Restricted by robots.txt"에 대한 웹 마스터 도구 오류 섹션에 4000 페이지가 넘는 페이지가 있으므로 너무 늦을 때까지이 오류를 선택하지 않았습니다.

다행히도 내 사이트의 모든 "중요한"페이지가 사이트 맵에 있기 때문에 웹 마스터 도구가 사이트 맵의 페이지 문제에 대해 갖는 특수 오류 범주에서이 문제를 신속하게 감지 할 수있었습니다.

또한 @AJ Kohn이 언급것처럼 Sitemap 색인을 사용하여 내 사이트의 여러 섹션에 대한 색인 품질을 결정할 때 많은 이점을 얻을 수 있습니다 .


4

나는 이것을 직접 접하지 않았지만 내 프로젝트의 대부분은 사용자 계정이 필요한 응용 프로그램이나 사이트이므로 검색 엔진에 의한 색인 생성에 중점을 두지 않습니다.

SEO가 기본적으로 사이트 맵을 쓸모 없게 만들었다 고 들었습니다. 프로토콜을 보면 페이지가 얼마나 자주 변경되고 각 페이지의 상대적 우선 순위가 무엇인지를 나타내는 일종의 "명예 시스템"입니다. 수십 개의 SEO 회사가 필드를 오용하는 이유는 모든 페이지가 최우선입니다! 모든 페이지는 매시간 바뀝니다! -그리고 효과적으로 사이트 맵을 쓸모 없게 만들었습니다.

2008 년의이 기사 는 기본적으로 그렇게 말하고 있으며, 당신이하는 것과 같은 결론에 이르렀습니다. 사이트 맵은 꽤 쓸모가 없으며, 색인을 생성하도록 콘텐츠를 최적화하고 사이트 맵을 버리는 것이 더 좋습니다.


3

크롤링하자.

나는 다음을한다 :

  1. 이전 방식으로 사이트를 크롤링 할 수 있습니다.
  2. 사이트 맵 표시가있는 robots.txt가 있는지 확인하십시오.
  3. XML 사이트 맵을 작성하지만 제출하지 마십시오. 검색 및 색인 생성 프로세스의 일부로 크롤러가 필요에 따라 검색하고 사용하도록합니다.

확장 XML 파일을 생성하는데,이 파일은 여러 가지의 기초가됩니다.

  • HTML 사이트 맵 생성
  • 404 (찾을 수 없음) 페이지 도움말
  • 사이트 이동 경로 만들기 또는 페이지의 Facade 패턴에서 일부 메타 데이터 가져 오기와 같은 다른 작은 작업에 도움이됩니다.

따라서이 모든 것을 갖추고 있으므로 xml 사이트 맵을 제공하고 크롤러가 원하는 작업을 수행하도록하십시오.


3

Jeff, 저는 평생 업데이트 된 웹 사이트의 웹 마스터가 될 기회가 없었기 때문에 Stackoverflow에 대해 전혀 몰랐습니다.

자주 변경되지 않는 작은 웹 사이트의 경우 다음 두 가지 이유로 사이트 맵이 매우 유용하다고 생각합니다 (사이트 맵이 가장 중요한 것은 아니지만 매우 유용합니다).

  1. 사이트가 빨리 크롤링되고 ( 위의 Joshak 답변 과 같은 이유 ) 작은 경험으로 작은 사이트 (최대 30/50 페이지) 에서이 사실을 여러 번 발견했습니다.

  2. 몇 주 후에 사이트 맵을 제출 한 후 "Google 웹 마스터 도구-사이트 맵"을보고 사이트 맵에 제출 된 URL 수와 웹 색인의 URL 수를 확인할 수 있습니다. 그들이 같다는 것을 알면 좋습니다. 그렇지 않으면 웹 사이트에서 색인이 생성되지 않은 페이지와 이유를 즉시 확인할 수 있습니다.


3

이것은 Randfish 에 의해 2007 년 좋은 해 에 SEOmoz에서 작성 되었습니다. 처음으로 그는 같은 유형의 결론에 도달했지만 시간이 걸렸 습니다 ...

그는 이후 (2009 년 1 월) 사이트 맵 생성, 확인 및 제출의 전체 긍정적 인 결과로 인해 가능한 단점이 더 많다는 기사를 포스트 스크립트로 추가했습니다.

2009 년 1 월 5 일 업데이트-실제로이 조언에 대해 마음이 크게 바뀌 었습니다. 예, 사이트 맵은 여전히 ​​아키텍처 문제를 모호하게 만들 수 있지만 지난 1.5 년 동안의 경험을 고려할 때 이제 모든 고객 (및 거의 모든 다른 사람)에게 사이트 맵을 제출하도록 권장합니다. 크롤링, 인덱싱 및 트래픽 측면에서 긍정적 인 점은 단점보다 더 중요합니다.


2

요즘 SiteMap은 두 가지 용도로만 사용됩니다.

  • 서버로드를 완화하기 위해 스파이더 링 빈도를 줄일 수 있습니다. 이것은 대부분의 사이트에서 실제로 문제가되지는 않습니다.
  • 그들은 검색 엔진이 당신에 대해 이미 알고있는 것을 다시 시행하도록 도울 수 있습니다. 페이지 이름을 나열하고 각 페이지에 적절한 가중치를 추가하면 검색 엔진이 사이트 아키텍처 순위를 매기는 자체 메트릭을 검증 할 수 있습니다.

1

사이트 맵을 사용하지 마십시오

사이트 맵은 주로 색인 및 노드에 타임 스탬프가없는 사이트를위한 것입니다 .... SE는 핵심 콘텐츠를 위해 두 가지를 수행하므로 사이트 맵을 사용하면 크롤러가 느려집니다 ... 예, 맞습니다. 사이트 맵 때문에 느리게합니다 핵심 인덱스에있는 메타 데이터가 없습니다. 반대로 구글이 어떻게 봇을 빌드하는지는 전혀 알지 못합니다 .SE를 봇으로하려고한다면 사이트 맵을 사용하지 않을 것입니다. 또한 일부 사이트는 사이트 맵이 모두 %! @ $라는 것을 알지 못합니다. 사이트 맵에 프로필을 작성하면 갑자기 작동하지 않아 새 프로필을 만들어야합니다. 실제 사이트.

그래서, 당신이 옳아 요 - 사이트 맵을 사용하지 마십시오!

힌트 : 그래도 한 가지해야 할 일은 시간이 지남에 따라 태그의 의미를 최대한 동일하게 유지하는 것입니다. 즉, "Asked One Hour Ago"에 메타 데이터가 포함되어 있으면 다음과 같습니다.

title="2010-11-02 00:07:15Z" class="relativetime"

relativetime데이터의 의미 title가 변경 되지 않는 한 문자열 이름을 변경하지 마십시오 . 절대로 ... :-)


1

최근에 작업중인 사이트를 재구성했습니다. 사용자를 돕기 위해 50 만 페이지를 연결하는 좋은 방법이 없었기 때문에 XML 사이트 맵을 사용하여 Google에 제출하고 대신 사이트 검색을 사용하기로 결정했습니다. Google은 사이트를 더 일찍 색인 생성하는 데 아무런 문제가 없었지만, 사이트 맵을 추가 한 이후 Google은 사이트를 스파이더 링하고 페이지를 매우 빠르게 색인 생성하는 데 매우 적극적입니다. Google은 사이트 맵을 사용하여 새 페이지 (주당 약 3300)를 찾고 업데이트 된 페이지를 다시 방문했습니다. 내 책에서 정말 승리했다. 여전히 내 페이지를 연결하고 AJAX를 사용하여 조회하는 새로운 방법을 찾고 싶지만 다른 날의 프로젝트입니다. 여태까지는 그런대로 잘됐다! 그것은 나에게 좋은 해결책이었습니다. 모두와, 나는 얻었고 잃지 않았습니다. 사이트 맵이 실제로 더 유용하지만 디자인에 의해 제한 될 수 있다고 항상 느꼈기 때문에 흥미 롭습니다.


0

사이트 맵이 귀하의 페이지를 보충 색인에 더 빨리 넣는다 고 들었습니다. 그러나 나는 나이에 언급 된 보충 지수를 듣지 못했기 때문에 더 이상 그것을 사용하지 않을 수 있습니다.

PS 내 진술이 충분히 명확하지 않은 경우 보충 색인에있는 것은 나쁜 것입니다 (따라서). 그러므로 사이트 맵은 나쁜 것입니다.


0

Google robots.txt은 홈페이지가 가장 높은 사이트인지 확인하기 위해 사이트 맵 (검색 엔진에 제출되지 않았지만 링크 된 )을 사용합니다 <priority>. 그들이 다른 용도로 사용되는지 잘 모르겠습니다.


0

Google이 사이트 맵 전용 링크를 색인 생성하지 않을 것에 동의하지 않습니다. 사이트 맵을 통해서만 페이지에 접근 할 수있는 수많은 사이트가 있으며 Google은 문제없이 색인을 생성합니다. 이에 대한 많은 예를들 수 있습니다.


이 페이지가 사이트 외부 에도 연결되어 있습니까?
Jeff Atwood

0

잘 구성된 사이트는 커버리지 및 순위를 지원할 수 있지만 우선 순위, 업데이트 빈도 등과 같은 약간의 추가 값을 추가 할 수 있지만 사이트 맵이 필요하지 않습니다. 검색 엔진에 알릴 수 있습니다 ...이 페이지를 업데이트했습니다 전체 크롤링을 요구하지 않고 내 사이트 중앙 어딘가에 있습니다. 나는 크롤링 패턴을 본 적이 없지만 도움이되기를 바랍니다.

저에게있어 실질적인 장점은 웹 마스터 도구이며 웹 사이트 가시성 및 사용자에 대한 통찰력입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.