Google 웹 로그 분석 리퍼러 스패머와 싸우는 방법?


43

지난 달에는 GA 통계에 많은 리퍼러 스패머가 있습니다. 그들의 수는 합법적 인 방문자 수보다 ~ 10 배 더 높습니다 (내 사이트는 아직 인기가 없습니다). GA 설정에서 알려진 스패머를 숨기는 옵션을 설정했지만 전혀 도움이되지 않았습니다. 이 스패머는 스크립트를 사용하여 GA에 직접 스팸을 보내는 것 같습니다 (즉, 내 IIS에 로그인되어 있지 않습니다).

이 스패머를 막기 위해 내가 할 수있는 일이 있습니까?

UPD는 10 개월 후 가짜 대상 페이지 이름을 사용하여 스팸을 시작했습니다. Google은 여전히 ​​아무 것도하지 않습니다.


1
조회자 스팸으로 적중에 대한 로그 파일을 기록하고있는 경우 알려주십시오. 가능하면 질문을 편집하고 문제의 리퍼러 스팸을 포함 시키십시오. 나는 이미 답을 알고 있다고 생각합니다. 나는 약간의 연구를하고 있으며 최근에 내가 경험 한 것들 중 상당수의 레퍼러 활동이 있습니다. 또한 WordPress를 설치 한 경우 최신 버전인지 확인하십시오. 사이트 중 하나가 WP 취약점을 겪고있는 것으로 보입니다. 또한 Curl과 같은 텍스트 브라우저를 사용하지 않는 한 이러한 사이트를 방문하지 마십시오.
closetnoc

@closetnoc,이 스패머는 내 서버에 로그온되어 있지 않습니다. 내가 쓴 것처럼 그들은 GA에 직접 스팸합니다. WP를 사용하지 않습니다. "문제의 리퍼러 스팸 포함"-무슨 의미입니까?
user626528

나는 그들이 누군지 알고 답변을 게시했습니다.
closetnoc

이를 방지하는 가장 쉽고 쉬운 방법은 다음을 사용하는 것입니다. referrerspamblocker.com Google 애널리틱스의 필터 자동 설정입니다. 몇 달 동안 사용했습니다.
Rody van Sambeek

Google 웹 로그 분석 설정에서 '봇 필터링'을 true로 설정하면 문제를 해결하는 데 도움이됩니까? - lunametrics.com/blog/2014/08/07/...

답변:


7

스팸이 통제 불능 상태입니다. 이 목록은 점점 커지고 있으며 시간이 많이 걸리며 각 스패머 에 대해 필터를 추가하는 것이 효율적이지 않습니다 .

잘못된 정보가 많으며 가장 일반적인 실수는 .htaccess를 사용하는 것이 좋습니다 .이 파일은 웹 사이트에 대한 액세스를 차단하지만 대부분의 스팸은 차단할 수있는 것보다 크롤러 (5 또는 6)가 적습니다. 귀하의 사이트에 절대 액세스하지 마십시오 . 유령 스팸입니다.

가장 좋은 방법은 스팸 (유령)의 유형을 막을 수는 만드는 것입니다 유효한 호스트 필터 때문에이 필터는 끝없는 필터를 추가 할 필요가 없습니다, 유령 스팸 사용하거나 가짜 또는 설정되지 않은 호스트 이름을, 하나 개의 필터가 소요됩니다 기존 및 새 스팸 관리. . 이 솔루션을 3 개월 동안 성공적으로 사용했습니다

이 방법에 대한 자세한 내용은 여기를 참조하십시오.

https://stackoverflow.com/a/28354319/3197362


이것이 받아 들여지는 답변이므로 정말 감사하겠습니다. Analytics의 대부분의 스팸 리퍼러는 고스트 리퍼러입니다. 당신이 차단해야 할 것이 몇 가지 .htaccess있지만, 그것은 수치를 왜곡하는 것을 막기 위해 진행중인 전투입니다.
GeoffAtkins

카를로스 사이트 에서 스팸 방지를위한 안내서를 추천하려고합니다 . 나는이 의견이 SEO / 판매 방법으로 인식 될 것이라고 알고 있지만 그렇지 않다. 이 안내서에 대한 여러분의 의견에 진심으로 감사드립니다.
Ooker

35

괜찮아. 문제의 사이트를 알지 못하면 진행중인 작업에 대해 설명하고 몇 가지 링크 만 제공합니다.

발신 : http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

사람들이 늦게보고있는 새로운 참조 스팸 방법과 관련된 도메인 이름은 다음과 같습니다.

  • BlackHatWorth.com
  • Iskalko.ru
  • Lomb.co
  • Lombia.co
  • Econom.co
  • Darodar.com
  • ILoveVitaly.Com
  • Priceg.com
  • Hulfingtonpost.com (2015 년 1 월 16 일 새로 추가됨)
  • Bestwebsitesawards.com (New- 추가 2015 년 2 월 3 일)
  • Ranksonic.info (New- 추가 2015 년 2 월 3 일)
  • Cenoval.ru (2015 년 2 월 6 일 새로 추가됨)
  • oo-6-oo.com (신규 추가 2015 년 2 월 25 일)
  • Humanorightswatch.org (2015 년 3 월 4 일 새로 추가됨)
  • S.click.aliexpress.com (2015 년 3 월 17 일에 새로 추가됨-의심 됨)
  • www1.social-buttons.com (2015 년 3 월 23 일 새로 추가됨-의심 됨)
  • 4webmasters.org (2015 년 3 월 26 일에 새로 추가됨-의심 됨)
  • Googlsucks.com (New-Added Apr 07 2015)
  • Addons.mozilla.org (신규 추가됨 2015 년 4 월 7 일-의심 됨)
  • Smallseotools.com (새로 추가됨 2015 년 4 월 13 일-의심 됨)
  • Theguardlan.com (2015 년 4 월 14 일 새로 추가됨)
  • Buy-cheap-online.info (새로 추가됨 2015 년 4 월 16 일-의심 됨)
  • Site1.free-share-buttons.com (새로 추가됨 2015 년 4 월 29 일-의심 됨)
  • Sanjosestartups.com (2015 년 5 월 25 일 새로 추가됨)
  • Trafficmonetize.org (2015 년 6 월 3 일 새로 추가됨-의심 됨)
  • Howtostopreferralspam.eu (새로 추가됨 2015 년 6 월 9 일-의심 됨)
  • www.10-free-social-buttons.com (2015 년 6 월 16 일에 새로 추가됨-의심 됨)
  • Getitfree.us (신규-2015 년 6 월 18 일 추가됨 소유권을 확인할 수 없습니다. 감사합니다-Trey Copeland)
  • www.6.free-social-buttons.com (2015 년 6 월 18 일 새로 추가됨-의심 됨)
  • Erot.co (새로 추가됨 2015 년 6 월 26 일-의심 됨)
  • 3g2upl4pq6kufc4m.onion (새로 추가됨 2015 년 7 월 4 일-의심 됨)
  • Traffic2money.com (신규 추가 2015 년 7 월 28 일-의심 됨)

참고 : 의심되는 항목-동일한 소유권 패턴을 따르는 것으로 보이며 동일한 위반자에게 연결되지 않을 수 있습니다.

Piwik에서 유지 관리하는 스팸 참조 페이지는 https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt 에서 찾을 수 있습니다 (감사합니다-user2428118).

인용 :

BlackHatWorth.com은 2015 년 1 월 7 일에만 만들어진 비교적 새로운 도메인으로, 현재 참조 스팸에 사용되고 있습니다. 실제로이 추천 스팸 웹 사이트는 쇼핑 검색 엔진 이름과 아름다운 풍경 이미지 뒤에 숨겨져 있습니다.

... 78.110.60.230 인 BlackHatWorth.com의 IP 주소는 다른 추천 스팸 웹 사이트와 동일한 주소입니다 ...

실제로 BlackHatWorth.com 도메인은 ILoveVitaly.com, Econom.co 및 Darodar.com과 같은 다른 추천 스팸 도메인을 소유 한 동일한 러시아인이 소유합니다. 도메인 소유자의 이름은 아마도 Samara (도시), Samaraskaya Oblast (주), 러시아의 Vitaly A Popov입니다.

당신은 이것을 막을 수 없습니다!

보낸 사람 : http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

인용 :

다음은 Google 웹 로그 분석 작동 방식에 대한 간단한 입문서입니다.

따라서 GA를 설정하고 코드를 얻습니다. 코드는 UA-number-1 또는 이와 유사한 것 같습니다. 이 번호는 GA의 '계정 번호'입니다. 이제이 코드와 약간의 자바 스크립트가 웹 페이지로 이동합니다. 이제 누군가가 귀하의 페이지를 방문하면 브라우저가 해당 자바 스크립트 코드를 실행합니다.

그 자바 스크립트 코드는 그들의 방문을“기록”하는 것입니다. 브라우저가 Google 웹 로그 분석과 대화하게합니다. 특히, Google이 정보를 기록하는 특정 유형의 HTTP 요청을 한 다음 GA는 해당 정보의 요약을 귀하에게 표시합니다.

아주 기본 이지요? 아직도 나와 함꼐? 자 이제이 자바 스크립트가 "방문"을 보내는 것이라면 누구나 가짜로 만들 수 있습니다. 누구든지 GA에 허위 정보를 표시하기 위해해야 ​​할 일은 가짜 정보를 GA에 직접 보내는 것입니다.

나는 당신의 사이트를 전혀 방문 할 필요가 없습니다. 나는 자바 스크립트를 전혀 실행할 필요가 없습니다. 공개 된 HTTP 요청을 재현해야하므로 누구나 볼 수 있으며 작동 방식을 알 수 있습니다. Google 자체적으로 공개적으로 문서화되어 있습니다.

이제 스팸 발송 자라고 가정하겠습니다. 사람들이 내 스팸성 사이트를 보도록하고 싶습니다. 그래서 어떻게해야합니까? GA에 수천 건의 가짜 요청에 수천 건을 전송하는 간단한 코드를 작성하고 모든 UA 번호를 순서대로 무작위로 순환합니다. 가짜 리퍼러와 스팸 도메인 이름으로 가짜 방문을 보냅니다. 그리고 무엇을 추측합니까? Google 웹 로그 분석 화면에 표시됩니다.

다른 일반 방문과 마찬가지로이 스팸이 표시됩니다. GA에 관한 한 정상적인 방문이었습니다. 그들이 기록하는 것은 일반적으로 GA 자바 스크립트 코드에서 온 HTTP 요청입니다. 그러나 요청은 요청이며, 가짜 요청은 매우 쉽고 쉽습니다.

그게 무슨 일이야. 내가 필요한 것은 귀하의 UA 번호이며 약간의 노력만으로도 귀하의 사이트에 실제로 연결하지 않고도 귀하의 사이트 방문을 가짜로 만들 수 있습니다. 이 가짜 방문에는 내가 선택한 도메인 이름과 추천자가있을 수 있습니다.

이는 사이트가 표시되는 것을 홍보하기 위해 Google 웹 로그 분석에 대한 공격입니다. 서버가 전혀 관여하지 않기 때문에 서버에서 차단할 수 없습니다.

두 가지 작업을 수행 할 수 있습니다. 하나는 John Conde가 제안한대로 필터를 설정하는 것입니다. 둘째, Google에 알리는 방법이 있는지 확인하십시오. 나는 대답이 없지만 아이디어가 있습니다.

[최신 정보]

이는 다음과 같은 광고를 완전히 처리하기 위해 하루에 수백 건의 스팸 공격에서 엄청나게 많은 비율에 도달하기 시작했습니다.

여기에 이미지 설명을 입력하십시오


2
@JohnMueller 이것은 내 영역에 속하지 않지만 G가 이것에 대해 알고 있는지 확인하기 위해 전자 메일을 보낼 수 있습니까? 미리 감사드립니다 !!
closetnoc

2
@JohnConde 감사합니다! 존 뮬러 (John Mueller)는 이것에 대해 알지 못할 수도 있지만 G의 누군가는 그렇게해야합니다. 대답이 없더라도 적어도 G는 아직 답이 없으면 머리를 숙여 야합니다. 우리 모두에게 옳은 일입니다. 건배!
closetnoc

1
@JohnConde BTW- 다른 SE 사이트 및 관련 사이트에서 이에 대한 질문을 보았습니다. 메모를하지 않았지만 다른 Mod에게 메모를 전달하는 좋은 방법이 있습니까? 아니면 Google에서이 도메인 이름 만 사용하여 답변과 게시물을 찾아야합니까?
closetnoc

1
@joelmdev 차단할 수 없다는 점을 놓쳤습니다. 이것은 Google에 대한 직접적인 공격입니다. Google 이외의 사람은 아무도 통제 할 수 없습니다. 그들은 통보를 받았으며 대부분 중지되었습니다.
closetnoc 2019

2
@Steve 나는 큰 보수가 있음을 알 수 없지만 어딘가에 있어야합니다. 답변에서 언급 한 개인은 Google을 싫어하고 최소한 Google을 당황하게하고 싶어합니다. 그러나이 스팸을 사용하여 등록 된 다양한 웹 사이트로 트래픽을 유도하고 있습니다. 이 방법을 사용하는 광고와 같은 것을 보았습니다. 지옥만큼 성가시다 !! 구글보다 무고한 사람들에게 상처를주고 있습니다. 나는 그것이 작동한다고 가정합니다 ... 매우 슬프다.
closetnoc

5

필터만들어 제외시킬 수 있습니다 . 우발적으로 좋은 방문자를 차단하지 않도록 특정 항목을 충분히 찾아야하며 각 스패머를 수동으로 추가해야하므로 번거롭지 만이 방법을 사용하면됩니다.


도움이 될만한 IIS 조언이 있습니까? Apache를 도울 수 있지만 OP에는 IIS가있는 것 같습니다.
closetnoc

2
그들이 내가 말한 것처럼 웹 사이트를 방문하지 않으면 효과적인 차단 방법이 될 수 없습니다. 아니면 질문을 잘못 읽었습니까?
John Conde

OP가 리퍼러 스팸으로 인기를 얻었을 때 읽었습니다.
closetnoc

2
실제로, 그들은 분명히 사이트를 방문하는 대신 GA를 직접 공격하고 있습니다. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde

괜찮아. 네 말이 맞아 내 잘못이야!! 나는이 질문 직전에 이것에 대해 읽었 기 때문에 왜 이것을 선택하지 않았는지 잘 모르겠습니다. 리퍼러 스팸에 타격을 받고 있으며 한 기사에서 로그 파일에 항목이 없다고 언급했습니다. 재미있는 새로운 방법.
closetnoc

4

제목 질문에 직접 "리퍼러 스패머를 퇴치하는 방법"에 대답하려면 가장 간단한 답변은 Google Analytics삭제하고 Piwik으로 전환하는 것 입니다. 기본적으로 모든 리퍼러 스팸 을 자동으로 차단합니다 .

Google 웹 로그 분석에 익숙하고 계속 사용하기를 원하지만 더 큰 그림을 보면 매우 효과적인 다른 옵션이 있습니다. 원하는 경우 방문자 IP 주소를 기록하도록 Piwik을 구성 할 수도 있으며 일부 사용자에게 호소 할 수있는 타사 광고 회사에 방문자 데이터를 유출하지 않습니다.


2
그런데 Piwik이 사용하는 리퍼러 스팸 블랙리스트는 오픈 소스입니다. github.com/piwik/referrer-spam-blacklist
Matthieu Napoli

스팸 데이터베이스는 매우 작습니다. 내 분석 보고서에 언급 된 도메인조차도 아닙니다.
Don Dilanga

1

IIS에서 작동하는 규칙은 다음과 같습니다.

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>

2
이 답변은 스패머가 OP의 웹 서버를 우회하여 Google Analytics에 직접 스팸을 보내므로 OP의 질문과 아무 관련이 없습니다.
Alfred Myers

@AlfredMyers 귀하의 의견은 일부 스패머가 웹 서버 방법을 사용하기 때문에 일부는 귀하가 언급 한대로 직접 방법을 사용하기 때문에 부분적으로 사실입니다. 후자의 경우 유일한 해결책은 Google Analytics에 필터를 추가하여 깔끔한보고를 얻는 것입니다. 이를 방지하기 위해 Google은 GA 계정에 더 긴 해시 고유 식별자를 사용하여 스패머가 사용 가능한 숫자와 실행 쿼리를 반복 할 수 없도록하는 것이 좋습니다.
Flo

OP는 구체적으로 "...이 스팸 발송자들은 스크립트를 사용하여 GA에 직접 스팸을 보냅니다 (즉, 내 IIS에 로그인되어 있지 않습니다)". 따라서이 특정 질문에 대해서는 웹 서버에 액세스하지 않습니다.
Alfred Myers

1

여전히 솔루션을 찾고 있는데 참조를 이해할 수없는 경우, 참조 스팸 제거에 대한 결정적인 안내서가 있습니다. 이제는 2014 년 12 월 28 일 이후 133 번째 개정판입니다. http://www.analyticsedge.com/2014 / 12 / removing-referral-spam-google-analytics /

TL; DR :

  • 유효한 호스트 이름 필터는 모든 유령 조회를 제거합니다 (hostname mydomain.com 포함).

  • 특정 제외 필터 (또는 웹 사이트 차단)는 훨씬 짧은 스팸 크롤러 목록 (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | buttons-for)을 제거합니다. -website.com | buttons-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • 내역 세그먼트에서 고급 세그먼트를 사용하여 제거 할 수 있습니다.

고급 세그먼트는 Google 웹 로그 분석 솔루션 갤러리 ( https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT) 에서 가져올 수 있습니다. % 26_.viewId % 3DGjpPQhFgS9aVzniXH4MTIg /


0

작년 초, Google Analytics 스팸에 대한 최상의 솔루션을 찾는 일을 맡았습니다. 다른 사람들과 마찬가지로 권장되는 방법을 시도했지만 그다지 효과가없는 것 같습니다. 그래서 다음에는 Google 태그 관리자를 사용했지만 그다지 도움이되지 않는 것 같습니다. 답답하고 혼란스러워서 가장 일반적이고 성가신 형태의 스팸에 대한 대책을 통합하여 Google 웹 로그 분석 추적 스크립트를 다시 작성하기로 결정했습니다.

1.5 년 동안 꾸준히 구축, 테스트, 디버깅 및 리팩토링을 수행 한 후 완벽하지는 않지만 이제는 기본적으로 잘 작동하고 쉽게 사용자 정의 할 수있는 상당히 안정적인 Google 웹 로그 분석 추적 스크립트가 있습니다. 측정 항목을 충족하려는 사용자에게는 매력처럼 작동합니다.

https://github.com/nickolasburr/intelligent-ga-tracking

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.