Joomla에서 중복 된 콘텐츠 / URL을 처리하는 방법은 무엇입니까?


11

방금 주요 SEO 문제를 발견했으며 한동안 해결했습니다. 나는 그것이 왜 처음에 발생했는지, 실수가 있었는지 또는 Joomla 자체와 관련이 있는지 알아 내려고 노력하고 있습니다. 먼저 문제 :

Moz를 사용하여 사이트를 크롤링 할 때 예상치 못한 홈페이지에 대해 4 개의 중복 컨텐츠가 표시되었습니다. 예를 들어 홈페이지 http://www.foo.com의 경우 다음과 같은 중복 콘텐츠 URL이 표시되었습니다.

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

이 모든 링크는 단순히 홈페이지 콘텐츠를로드하는 중이지만 메타 세부 정보는 기사에서 가져 왔습니다. 이것은 분명히 Joomla가 링크를 자동으로 생성하고 있음을 나타내 었으며 4 개의 링크에서 동일한 것을 발견했습니다. 기사의 링크는 다음과 같습니다.

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Itemid = 1홈페이지가 로딩 된 이유를 설명 홈페이지 메뉴 항목에 해당합니다. 문제를 재현하려고 시도했지만 실패했습니다. 컨텐츠를 추가 한 사람들에 따르면 다음은 기사 및 링크를 작성할 때 수행 한 단계입니다.

  1. 기사 만들기
  2. 컨텐츠 편집기에서 '기사'탭을 사용하여 다른 기사에 대한 링크를 추가하십시오.
  3. 기사에 메뉴 항목 만들기

그래서 여기에 분명히 잘못된 것이 있는지 궁금합니다. 100 개가 넘는 기사가 있기 때문에 혼란 스럽지만 아직 약 5 기사 만 발생했습니다. 감사.

답변:


15

이 답변의 목차 :

  1. 동일한 항목 ID 아래의 콘텐츠
  2. 중복 콘텐츠 생성 방법 / 동적 페이지 / URL
  3. SEO 관점
  4. Joomla의 중복 컨텐츠 다루기
  5. 참조 및 링크

1. 기사가 동일한 itemid 아래에 표시되는 이유

우선, 이것은 URL이 중복되는 이유가 아닙니다. 기사에 다른 항목 ID가 할당되어 있지 않으므로 기사가 홈페이지의 항목 ID를 사용하고 있습니다.

이것에 대해 더 읽으십시오 :

그리고 이것은 또한 통찰력이 있습니다.



2. "중복 컨텐츠"작성 방법 / 동적 페이지 / URL

이는 실제로 URL 매개 변수 를 사용하여 필드-값 쌍 의 형태로 쿼리 문자열 을 구성 하여 페이지를 생성하는 동적 웹 사이트의 표준 동작입니다 . 서버 / 응용 프로그램은 쿼리를 수신하여 처리 한 다음 관련 콘텐츠를 브라우저에 반환합니다.

이것을 더 잘 이해하려면 Joomla 웹 사이트에서 SEF Urls를 비활성화하고 페이지의 비 SEF URL을 조금 연구하십시오.

예:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

위의 쿼리를 필드-값 쌍으로 나누면 다음과 같습니다.

  • 옵션 = com_content
  • 보기 = 기사
  • id = 3
  • catid = 9
  • 아이템 ID = 101

Joomla가 이해하고 다음 내용을 다음과 같이 반환하려고하는 필드 값입니다.

com_content 구성 요소를 조회하고 기사보기를 사용하여 id 101의 메뉴 항목을 사용하여 카테고리 id 9의 id 3으로 컨텐츠 항목 (문서)을 표시합니다.


1 페이지의 다양한 URL 변형

그러나 더 많은 필드-값 조합으로 동일한 기사를 표시 할 수 있습니다.

가능한 조합은 다음과 같습니다.

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = en
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en & tmpl = component

보시다시피, 위의 모든 항목은 시스템에서 동일한 데이터를 요청합니다. id = 3 인 기사는 다양한 URL을 통해 동일한 콘텐츠 / 페이지에 액세스 할 수 있으며 경우에 따라 다른 레이아웃으로 표시됩니다.

* Joomla에서 SEF URL을 사용하면 위의 내용이 동일한 기사 / 콘텐츠에 대해 둘 이상의 SEF URL로 변환 될 수 있습니다.



3. SEO 관점

최신 검색 엔진Google은 특히이 동작을 알고 있습니다. 일반적으로 페이지에 가장 적합한 URL을 색인화하고 검색 결과에 유지하기 위해 최선을 다할 것입니다. 또한 Google은 이로 인해 복제 된 콘텐츠에 대한 실제 " 페널티 " 가 없음을 밝혔습니다 .

그러나, 동일한 콘텐츠 / 페이지가 한 번 이상 색인되어있는 경우의 주요 문제는 당신이 가능하게 잃어버린된다는 것이다 랭킹 페이지 와 최고의 SEO 성능을 페이지가 1 개 이상의 페이지에 분할 대신 1이됩니다 랭킹 있기 때문에, .

이를 염두에두고, 다른 URL이 동일하거나 다른 콘텐츠를 표시하는지 추측하는 동안 검색 엔진이 URL을 색인화하는 대신이 문제를 처리하는 것이 좋습니다.
또한 사이트 사용자는 하나의 표준 URL에서 동일한 페이지를 찾을 수 있으므로 웹 사이트 및 관리를위한보다 견고한 구조를 생성 할 수 있으므로 URL 및 SE의 색인 생성 대상을 제어하면 전체적으로 더 나은 사용자 경험을 제공 할 수 있습니다. .



4. 중복 컨텐츠를 다루는 방법

  • 페이지에 표준 URL 사용
    Canonical Urls는 검색 엔진에 크롤링하고 색인으로 유지해야하는 페이지의 올바른 URL을 검색 엔진에 지시합니다.

  • INDEX / NOINDEX, FOLLOW / NOFOLLOW 메타 데이터를 사용합니다. 페이지에서 이러한 메타 데이터를 사용하면 검색 엔진이 페이지의 콘텐츠를 색인화하거나 검색하지 않고 페이지의 링크를 따르거나 원하지 않게하려는 경우 검색 엔진에 지시합니다.

  • 301 리디렉션 / htaccess 사용
    다른 모든 URL을 기본 URL로 리디렉션 할 수 있습니다. 이는 SEF Extensions 또는 htaccess 로 달성 할 수 있습니다 . 둘 다 강력한 기능을 제공하지만 htaccess는 모든 종류의 리디렉션에 대해 정규 표현식을 사용하거나 mod_rewrite를 사용하여 다시 쓰는 기능을 고려할 때 유연성이 뛰어납니다. J Extensions에 관해서는, 필요할 때 보통 sh404SEF를 사용 합니다.

    업데이트 : @Neil Robertson이 의견에 언급 한 것처럼 중요한 리디렉션 중 하나는 www 버전이 아닌 웹 사이트에서 www 버전의 웹 사이트로 또는 그 반대로입니다. www가 아닌 ​​www를 리디렉션하려면 .htaccess 파일에 추가하십시오.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Google 웹 마스터 도구 사용 Google 웹
    마스터 도구에는 크롤러의 URL 매개 변수 작동 방식을 조정하는 옵션이 있습니다 .

  • 사이트 맵 사용
    하기 사이트의 URL 구조를 검색 엔진에 제출하십시오.

  • Robots.txt 파일 사용
    Google 및 기타 주요 SE는 Robots.txt를 존중합니다. 특정 디렉토리 / URL 경로를 크롤링하지 않도록 지시 할 수 있습니다.

원하는 결과를 얻기 위해 위의 모든 옵션을 결합 할 수 있습니다.

* Jomla에서는 모든 곳에서와 마찬가지로 좋은 계획 및 콘텐츠 구성이 항상 더 나은 결과를 달성하도록 도와줍니다. 특히 Joomla에서는 깔끔한 콘텐츠 분류 및 메뉴 항목 구조도 필요합니다.



5. 참조 및 링크

Joomla SEO 확장

일반적으로 Joomla에서이를 효율적으로 처리하려면 타사 SEO-SEF 확장을 설치하게됩니다.



더 많은 독서 :


1
이 포럼에서 가장 좋은 답변 중 하나 :) 매우 도움이되었습니다. @FFrewin에게 감사드립니다
Joomler

1
이것은 훌륭한 답변입니다. :) 완벽을 기하기 위해 www가 아닌 ​​버전의 웹 사이트를 www의 웹 사이트 버전으로 리디렉션하거나 그 반대의 방법으로 정보를 추가하는 것이 좋습니다. 이것은 종종 잊혀지지 만 아마도 Joomla뿐만 아니라 모든 웹 사이트에서 중복 콘텐츠의 주요 원인 일 것입니다.
Neil Robertson

새로운 라우터가 Joomla 3.8에서 마침내 빛을 보게 될 것 같으며 타사 확장을 필요로하지 않고 URL을 단순화하는 데 도움이됩니다.
닐 로버트슨

1
@NeilRobertson : 여전히 Joomla에서 SEF URL / 중복을 관리하기위한 완벽하고 효율적인 솔루션을 위해 여전히 개선의 여지가 있으며 더 많은 작업이 필요하다고 생각합니다.
FFrewin

@FFrewin 동의합니다. 새 라우터를 이용하기 위해 일부 타사 확장 프로그램도 업데이트해야 할 수 있습니다.
닐 로버트슨

0

동일한 콘텐츠로 여러 메뉴 항목이있는 경우 메뉴 관리자에있는 시스템 링크 / 메뉴 항목 별칭을 사용합니다. 여기에 대한 오래된 기사가 있습니다. 그러나 방법은 오늘날에도 여전히 존재합니다 : https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@Neil, www가 아닌 ​​www가 아닌 ​​콘텐츠가 중복으로 읽히는 것에 대해 100 % 동의합니다. 다음은 www가 아닌 ​​www가되도록하는 코드입니다. htaccess 파일에 넣으십시오. 또한 https 보안 프로토콜도 추가합니다. 이 코드는 유일한 방법은 아니지만 많은 사이트에서 성공적으로 사용하고 있습니다.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.