답변:
웹 사이트에서 최근 영구적으로 제거 된 페이지에 대해 410 오류를 구현했습니다. Google 색인에 약 4 천만 페이지가 있으며 Googlebot이 매일 2 백만 건의 요청으로 크롤링합니다.
데이터베이스를 정리 한 후 웹 마스터 도구의 크롤링 오류에 수많은 404 오류가 계속 발생했습니다. 404 대신 410 개의 상태로 전환하면 하루에 발생한 오류 수가 절반으로 줄어든 반면 총 요청 수는 동일하게 유지되었습니다. 결국 하루에 더 성공적으로 크롤링 된 페이지입니다. 색인에서 완전히 제거되기 전에 상태가 404 인 페이지가 여러 번 크롤링되는 것처럼 보입니다.
따라서 Google 크롤링 예산을 유지하기 위해 410을 사용하는 것이 좋습니다.
이 세상에는 Google 이상의 것이 있습니다. 410은 봇에게 파일이 사라 졌다는 것을 분명하게 알려줍니다. 404는 그렇지 않습니다. 영구 봇은 404를 무한정 찾으려고 시도하는 반면 410은 즉시 410을 찾으려고 시도하지 않아 서버를 매우 행복하게 만들 수 있습니다.
Google보다 검색 엔진이 더 많을뿐 아니라 Google이 410 개의 응답을 처리하는 방식을 변경하지 않는다고 가정 할 이유도 없습니다. 실제로, 그것은 이미 일어난 것 같습니다 : 비디오에서 Matt Cutts 인용 정보는 2007 년이지만, 2009 년 Google의 Webmaster Central 포럼에 대한 John Mu의 게시물 은 그렇지 않다고 말합니다.
"저는 팀과 함께 404 대 410에 대해 조사했습니다. 여기 및 다른 곳에서 언급 한 바와 같이, 우리는 일반적으로 과거에 동일하게 취급 해 왔습니다.
그러나 실제로 웹 마스터가 웹 마스터를 어떻게 사용하는지 살펴본 후 410 HTTP 결과 코드를 404보다 "영구적 인"비트로 취급하고 있습니다. 따라서 페이지가 더 이상 존재하지 않으며 다시는 존재하지 않을 것이라고 확신한다면, 410을 사용하는 것이 좋습니다. "
따라서 Google은 실제로 410 응답을 404와 다르게 처리하는 것처럼 보입니다.
내 경험상 Google은 410 오류 코드를 이해하지 못합니다.
얼마 전 나는 모든 기존 URL이 "410 사라지도록"전체 사이트를 변경했습니다. 새 URL과 직접적인 관계가 없기 때문에 301 리디렉션을 사용할 수 없습니다.
.htaccess
Google에 이전 URL이 사라 졌다고 알리기 위해 사이트 를 사용 했지만 내 사이트에 404 개의 오류가 계속 발생하고 있습니다. 크롤링 오류 보고서에서 URL을 확인했으며 404가 아닌 410입니다.
이 세상에는 Google 이상의 것이 있습니다.
진실로 인용했다. 귀하의 요구 사항을 고려하여 페이지가 영구적으로 제거 되었다는 사실을 봇 (및 아마도 사람에게도)에게 알리기 위해 실제로 301
콘텐츠가 제거 된 이유를 설명하거나 봇 / 사용자를 가져 오는 페이지 로 리디렉션을 선택합니다 색인 페이지로 돌아갑니다.
덜 알려진 HTTP 오류 코드는 일반적으로 전반적으로 잘 지원, 이해 또는 구현되지 않으므로 일반적으로 예상되고 원활하게 탐색되는 브라우저 환경을 보장하기 위해 해당 코드를 고수합니다.
어떤 옵션을 사용할 것인지 선택하는 것은 (현재) 누락 된 콘텐츠에 대한 요청이 몇 건인지에 따라 다릅니다.