? utm_campaign 쿼리 문자열이있는 Google 색인 페이지가 왜


9

최근 Google에서 utm_campaign, utm_source 및 utm_medium 쿼리 문자열 인수가 포함 된 URL을 색인 생성하는 것으로 나타났습니다. 결과에서 Google은 표준 URL이 아닌 이러한 쿼리 문자열이 포함 된 URL을 표시합니다.

utm_campaign이 URL에 추가되었습니다

이 문제는 '중복 된 콘텐츠'문제 일 수 있음을 이해하지만 link rel=canonical웹 사이트 전체 에서 태그를 사용하고 있습니다. 일례로 :

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

표준 태그의 스크린 샷

Google은 색인을 생성하기 위해 표준 URL을 사용해야합니다. 내가 무엇을 잘못하고 있지?


2
표준 태그가 없어도 Googlebot은 추적에만 사용되는 UTM 매개 변수를 무시합니다. 나는 그것들이 전에 정식으로 색인되지 않은 것을 본 적이 없다.
Stephen Ostermiller

4
FWIW site:stackexchange.com inurl:utm_campaign는 비슷한 결과를 (약간 큰 규모로) 반환합니다. 또한 site:검색은 종종 결과에 비정규 URL을 반환하며 일반적으로 "정상"검색에서는 반환되지 않습니다. 그러나 위의 URL은 "정상"검색에서도 반환되는 것으로 보입니다.
MrWhite

답변:


3

귀하의 웹 사이트를 현재대로 검토 한 결과 이것이 더 이상 / 현재 문제인지 확실하지 않습니다.

이 문제는 웹 사이트에서 UTM 매개 변수를 포함하는 내부 링크가 아닙니다 (다른 질문에서 알 수 있듯이).

소셜 미디어에서 웹 사이트 콘텐츠를 공유 해야하는 일부 프로세스가 URL에 UTM 매개 변수를 남겨두고 어떤 시점에서 색인을 생성 한 URL을 공유하는 것처럼 보입니다.

이런 일이 발생하는 경우는 드물지만 이전에는 다른 여러 사이트에서 발생했습니다. 이 매개 변수로 색인이 생성 된 페이지가 3 페이지에 불과하다는 사실은 이것이 심각한 문제이거나 사이트 전체의 문제가 아님을 나타냅니다.

이를 방지하기 위해 취할 수있는 단계는 다음과 같습니다.

1. 페이지에서 표준 URL을 지정하십시오.

이미이 작업을 수행하고 있으며 구현이 정확합니다. 이렇게하면 지정된 표준 URL 만 검색 엔진에 가중치가 부여됩니다. 아마도 이것이 항상 제자리에 있었지만 그렇지 않은 경우 UTM 매개 변수로 색인이 생성 된 오래된 페이지 인스턴스가 왜 있는지 설명 할 수 있습니다.

표준 URL의 올바른 구현

2. Google이 Search Console에서 UTM 매개 변수를 색인화하지 않도록 지시합니다.

일부 URL이 UTM 매개 변수로 색인되는 경우 (귀하의 경우와 같이) URL 매개 변수는 도메인에 대한 Google 검색 콘솔의 '크롤링> URL 매개 변수'섹션에서 감지 된 것으로 표시되어야합니다 (아래 참조).

Google 검색 콘솔 UTM URL 매개 변수

UTM 매개 변수가 나타나지 않더라도 'Add Parameter'를 사용하여 작성할 수 있습니다.

단순히 No: Doesn't affect page content (ex: tracks usage)'수동 매개 변수'라고 선택하면 Google은 일반적으로 특정 매개 변수 값을 가진 하나의 URL 만 크롤링합니다 .

3 robots.txt에서 URL 매개 변수를 허용하지 않습니다

이렇게하면 실제 URL 자체가 아닌 이러한 URL의 콘텐츠를 Google이 색인 생성하지 못하도록 차단합니다 (검색 결과에는 계속 표시 될 수 있지만 아래 설명은 생략 함).

robots.txt에서 색인이 생성되지 않은 페이지

단순히 다음과 같은 것을 추가하면 이것을 처리 할 수 ​​있습니다 robots.txt:-

Disallow: /*?utm=*

결론

1 단계와 2 단계는 단계 1과 2뿐만 아니라 예방책과 "모범 사례"의 문제로 수행되어야합니다.

Google Search Console에는 URL을 (일시적으로) 제거하는 기능도 있습니다. 이 방법은 아직 색인이 생성 된 일부 완고한 페이지가 있지만 문제의 근본 원인이 해결되었으며이 기능이 검색 결과에서 한 번에 제거 할 수있을 정도로 충분해야하는 경우에 특히 유용합니다.

나는 이것을 전에 연구 했음에도 불구하고 매개 변수가있는 URL을 지원하는지 여부를 기억할 수 없기 때문에 위의 단계로 이것을 포함하지 않았습니다. 나는 한 번 대답을 알고 있었지만이 특별한 경우에 나의 기억은 저를 실패시킵니다.

더에 읽기 구글에서 URL을 제거 .


1
그러나 (# 3)을 사용하여 이러한 URL이 크롤링 되는 것을 robots.txt차단하면이 캠페인도 추적되지 않습니까? ... 또한 인 페이지 표준 태그를 읽지 못하게합니까 (# 1)?
MrWhite

나는 robots.txt에 대해 w3dk가 말하는 것과 동의합니다. noindex: /*?utm=*robots.txt에서 사용 하는 것이 있으면
Stephen Ostermiller

2

귀하의 웹 사이트 콘텐츠 내에서 이러한 링크를 사용하여 페이지를 연결하는 것 같습니다.

Google이 색인을 생성하지 않도록하려면 rel="nofollow"웹 사이트 내부의 링크를 추가 하고 robots.txt 파일에서 이러한 매개 변수를 차단하십시오.

Disallow : /*utm_campaign

내부 링크에 사용되는 것이 좋습니다. 그것은 일반적으로 인바운드 링크에서만 사용되는 대부분의 사이트와의 차이점을 설명합니다.
Stephen Ostermiller

실제로 utm_campaign URL은 Buffer.com에 의해 추가됩니다 (예 : "utm_source = plus.google.com & utm_campaign = buffer"). 웹 사이트 어디에서나 이러한 링크를 사용하고 있다고 생각하지 않습니다.
Brendon

1

표준 URL의 색인 생성 여부를 확인 했습니까? 표준 URL의 색인이 생성 된 경우 걱정할 사항이 없습니다.

Google 웹 마스터 도구를 사용해보고 여기에서 Google이 URL 매개 변수를 처리하는 방식을 변경할 수 있습니다 .


1
일부 URL의 경우 utm_campaign URL 만 색인화됩니다. 다른 페이지의 경우 두 URL이 모두 색인에 나타납니다. 어제 Google은 Fetch as Google 도구를 사용하여 하나의 URL (utm_campaign 쿼리 문자열 포함)을 크롤링했습니다.이 URL은 이제 사라진 것으로 보이고 표준 URL이 색인됩니다.
Brendon

또한 크롤링 통계 ( 스크린 샷 ) 는 크롤링 하는 데 시간이 오래 걸린 페이지 (평균 2.3 초)를 표시하는 것으로 보입니다. 이것이 광범위한 문제인지 확실하지 않지만 Google이 사이트를 크롤링하는 데 문제가있을 수 있습니다.
Brendon

방문자가 웹 사이트에 도착하면 약간의 정리를 수행 할 수도 있습니다. 링크 신선한 URL 스크립트를 사용 하여 UTM 매개 변수를 활용 한 후 URL에서 동적으로 모든 UTM 매개 변수를 제거하십시오. 둘째 URL 매개 변수를 추가 ...
무하마드 우스만
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.