데이터가 매일 업데이트되지 않는 경우 Google은 사이트 맵에서 매일 업데이트 된 <lastmod> 태그를 페널티합니까?


10

제품 페이지에 대한 많은 링크로 매일 생성되는 사이트 맵이 있습니다. 이러한 제품은 다른 데이터 소스에서 매일 가져옵니다. 업데이트는 모든 현재 제품 정보를 버리고 새로 가져온 정보로 바꾸는 것으로 구성되므로 마지막 수정 날짜는 항상 하루가됩니다. 이것은 사이트 맵에서도 사용됩니다. 변경되지 않은 제품의 경우에도 마찬가지입니다. 모든 제품 페이지가 업데이트 된 것처럼 가장합니다.

Google은 웹 사이트에 불이익을 주면서 페이지가 변경되었다고 주장하여 웹 사이트에 불이익을 주나요?

내 솔루션은 새로 가져온 제품 데이터가 이전 데이터와 다른 경우에만 항목을 변경하는 것입니다. 나는 이것이 유용한 업그레이드인지 확인하고 다른 개선에 시간을 할애 할 수 있기를 원합니다.

답변:


5

이로 인해 벌금에 대해 들어 본 적이 없습니다. 최악의 경우, 거미의 시간을 낭비하고 있지만, 이것이 우리가 처음에 컴퓨터를 가지고있는 이유 중 하나입니다 : 지루한 반복적 인 일을하는 것. 그래도 문제를 해결하는 것이 이상적입니다.

이...

내 솔루션은 새로 가져온 제품 데이터가 이전 데이터와 다른 경우에만 항목을 변경하는 것입니다.

... 사이트 맵 등과 같은 외부 고려 사항에 관계없이 처음부터 수행해야하는 작업입니다. 컨텐츠가 다르지 않은 경우 (그리고 해당 설명에서 동일한 정보로 삭제 및 교체하는 것을 포함 할 경우) lastmod날짜는 수정하지 마십시오. 여기 당신은 당신의 자신의 자원을 낭비하고 있습니다. 얼마나 많은 제품이 포함되어 있는지 말하지는 않았지만이 프로세스가 느리고 계산 비용이 많이 드는 시점이 있습니다.


전적으로 동의합니다. 그러나 데이터를 제공하는 다른 회사에 의존하고 있습니다. 그들은 항상 데이터 내보내기에서 모든 제품 (+200)을 보냅니다. 따라서 로트를 업데이트하는 것은 몇 년 전에 가장 좋은 해결책으로 보였습니다. 고객이이 문제를 제대로 해결할 예산이 없습니다. 이러한 전직 / 수입품은 밤에 발생하므로 추가 사용 된 자원은 현재 큰 문제가되지 않습니다.
Elicit

@이 문제가 계속 발생하면 전날의 데이터 내보내기를 구문 분석 가능한 원래 형식으로 저장하고 git diff 스타일 비교를 수행하여 변경된 제품을 확인하십시오. 훌륭하지만 변경된 제품 만 보낼 필요는 없습니다. 스스로 알아낼 수 있어야합니다.
익명 펭귄

3

나는 <lastmod>단지 잘못이 아니기 때문에 매일 업데이트하는 아이디어를 좋아하지 않았습니다. 오해의 소지가있는 검색 엔진입니다.

SO에 대한 게시물 에서 Google의 Gary Illyes는 다음과 같이 썼습니다.

sitmod에서 lastmod 태그는 선택 사항이며 대부분의 경우 웹 마스터가 정확한 작업을 유지하는 끔찍한 작업을 수행하기 때문에 검색 엔진에서 무시됩니다.

나는 일반적으로 <lastmod>올바르게 사용 하거나 전혀 사용 하지 않는 것을 옹호했습니다 . ( <changefreq>& 뿐만 아니라 <priority>) 파일을 그대로두면 검색 엔진도 파일 자체를 작고 빠르게 읽을 수 있습니다.


2

아니요. Google은 lastmod힌트 (모든 사이트 맵 값과 동일)로 사용하지만 콘텐츠가 매일 업데이트되지 않는 것으로 판단되면 무시하고 자체 일정대로 페이지를 다시 방문합니다.


2

나는 구글에서 일하지 않고 실제로 그들이하는 일을 확실하게 말할 수는 없지만 타임 스탬프 를 처리 하는 현명한 방법은 변경 되지 않은<lastmod> 페이지를 다시 크롤링하는 시간을 낭비하지 않는 힌트 일 것 입니다.

따라서 매일 변경된 페이지를 모두보고하면 Googlebot은 변경된 페이지에만 집중하기보다는 원하는 순서대로 모든 페이지를 계속 크롤링합니다. 실제로 마지막 수정 타임 스탬프를 전혀보고하지 않은 것과 같습니다.

정확한 <lastmod>타임 스탬프 를 제공하는 주된 이유 는 Google 색인에서 사이트 변경 사항을 더 빨리 표시하기 위해서입니다. 사이트에 수백 개의 페이지가있는 경우 Google에서 해당 페이지를 모두 크롤링하고 변경 사항을 찾는 데 다소 시간이 걸립니다. 그러나 최근에 어떤 페이지가 변경되었는지 Googlebot에 알려 주면 해당 페이지를 먼저 크롤링하여 나머지 시간에 많은 시간을 낭비하지 않아도됩니다.

물론 웹 마스터 도구에서 Googlebot의 크롤링 속도높이고 최상의 결과를 기대할 수 있습니다. 그러나 실제로 업데이트 스크립트가 타임 스탬프를 유지하도록하기가 어렵지 않아야합니다. 예를 들어, 현재 다음과 같은 일을하고 있다고 가정합니다.

for each product do:
    write new page content into product page file;
end do;

그렇다면 다음과 같이 변경하십시오.

for each product do:
    read old page content from product page file into string A;
    write new page content into string B;
    if A is not equal to B then:
        write string B into product page file;
    end if;
end do;


1

Google은 이에 대해 처벌하지 않습니다. 페널티를 받으려면 실제로 구글의 엉덩이에 검은 모자를 써야하므로 걱정하지 마십시오. Google은 콘텐츠에 변경 사항 (지난 몇 년 동안 작업 한 내용)이 있고 lastmod 속성을 힌트로 사용하는 경우 곧 알게 될 것입니다.


1

XML 사이트 맵 및 RSS / Atom 피드에 대한 모범 사례 를 읽어 보시기 바랍니다.

마지막 수정 시간

XML 사이트 맵 및 RSS / Atom 피드에서 각 URL의 마지막 수정 시간을 지정하십시오. 마지막 수정 시간은 페이지의 내용이 마지막으로 변경된 시간이어야합니다. 검색 결과에 변경 사항이 표시되도록하려면 마지막 수정 시간이이 변경 시간이어야합니다.

XML sitemap uses  <lastmod>
RSS uses <pubDate>
Atom uses <updated>

마지막 수정 시간을 올바르게 설정하거나 업데이트하십시오.

Specify the time in the correct format: W3C Datetime for XML sitemaps, RFC3339 for Atom and RFC822 for RSS.
Only update modification time when the content changed meaningfully.
Don’t set the last modification time to the current time whenever the sitemap or feed is served.

업데이트 해주셔서 감사합니다. 다행스럽게도 다운 보더가이를보고 투표를 취소하기를 바랍니다.
John Conde
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.