분석 : CloudFlare와 Google-차이가 너무 큽니까?


10

약 1 주일 동안 사이트 중 하나에 CloudFlare를 사용하고 있으며 CloudFlare는 Google Analytics보다 실제 방문자 페이지 뷰를 450 % 더 많이보고하므로 봇이나 위협을 차단하지는 않습니다.

CloudFlare가 모든 페이지 요청을 측정하고 페이지가 다운로드되면 Google Analytics가 JavaScript 요청을 시작하므로 불일치가 있음을 이해합니다. 20-30 %, 아마도 50 % 차이가 있지만 450 %가 준비 되었습니까?

어딘가에 문제가있는 것 같습니다. 크롬에 Google 웹 로그 분석 디버거를 사용했는데 모든 것이 제대로 작동하는 것 같습니다. GA 코드는 헤드에 있으므로 즉시 실행해야합니다.

그런 큰 차이가 정상입니까? 그렇다면, 왜, 그렇지 않다면, 지구상에서 무엇이 원인입니까?

업데이트

죄송합니다. 확실하지 않다고 생각합니다. CF를 시작하기 전에 CF 통계와 GA 통계의 차이점을 이해했으며 차이가있을 것으로 예상했습니다. 관련된 차이의 크기입니다.

CF는 봇과 크롤러를 일반 방문자와 명확하게 분리하므로 GA와 비교하는 수치는 일반 방문자 일뿐입니다. 차이점은 방문자 중 5 분의 1만이 Google 웹 로그 분석을 실행 한다는 것입니다 .

"your CloudFlare visitor number is most likely higher"

정의하지 않습니다!


더 큰 불일치에도 동일한 문제가 있습니다. 방문자 수는 이유가 될 수 있다고 생각합니다. GA가 한 달 동안 몇 페이지 뷰를보고합니까? 나에게 특정 기간 동안 CF가보고 한 페이지 뷰 수는 223.000.000이고 GA가보고 한 숫자는 22.000.000입니다. 이것은 로봇이나 .js 때문일 수 없습니다. GA 자체의 데이터 한도 때문이라고 생각합니다. 한 달에 10m 이상의 페이지 뷰에 대해 올바른 데이터를 제공한다고 보장하지는 않습니다. 어쨌든 이것은 내가 생각하는 것인데 여전히 확실하지 않습니다.
Manoochehr

또 다른 것은 이미지 중 하나가 핫 링크 된 경우 Cloudflare에 대한 방문을 유발할 수 있지만 그렇지 않아야합니다. 까다 롭습니다. 견실 한 방문은 Cloudflare보다 Google 웹 로그 분석에 의해 기록 될 가능성이 높습니다.
David 天宇 Wong

답변:


4

CloudFlare는이를 인정하고 다음 설명을 제공합니다 .

CloudFlare Analytics와 다른 서비스

Google 웹 로그 분석 및 기타 웹 기반 분석 프로그램은 JavaScript를 실행하는 방문자를 추적합니다. 결과적으로 위협, 봇 및 자동 크롤러는 일반적으로 JavaScript를 트리거하지 않으므로 기록되지 않습니다. 이 서비스는 또한 페이지가 완전히로드되거나 Javascript가 비활성화되기 전에 페이지를 떠나는 방문자를 추적하지 않습니다. CloudFlare는 요청별로 모든 트래픽을 추적하므로 CloudFlare 방문자 수가 가장 많을 수 있습니다.

명심하십시오 : CloudFlare는 DNS 설정 페이지에서 주황색 구름으로 표시되는 CloudFlare 시스템을 방문하는 방문자 만 추적 할 수 있습니다.

그들은 자신의 분석이 "자바 스크립트에 의존하는 다른 서비스보다 더 정확하다"고 주장합니다.


시간 내 주셔서 감사합니다, 그러나 추론을 이해합니다, 그것은 차이의 규모에 의해 내 마음이 날아간 것입니다! 좀 더 자세하게 질문을 업데이트했습니다
CodeMonkey

4

Apache 로그를 분석과 비교할 때 비슷한 차이점을 관찰했으며 1000 : 1의 (1 일) 비율을 보았습니다. 원격으로 NoScript 및 Ghostery와 같은 제품으로 Google 분석을 차단하거나 자바 스크립트를 전혀 실행하지 않는 사용자 기반이있을 수 있습니다. 나는 것으로 나타났습니다 Piwik이 더 나은 보고서를 제공하고 추적기 차단제는 여전히 1x1 픽셀 이미지 추적 방식을 통해 추적 할 수있는 자바 스크립트와의 스크립트와 사용자를 차단하지 않도록 설정할 수 있습니다. 그러나 CloudFlare 또는 CDN에 대한 실제 경험이 없으므로 Piwik의보고에 영향을 미치는지 모르겠습니다.


GA를 차단하는 80 %가 나에게 매우 높은 것 같습니다. 호기심에서 아파치 로그를 분석하고 봇 및 위협을 필터링하기 위해 무엇을 사용 했습니까?
CodeMonkey

플러그인을 통해 적극적으로 차단하는 사용자의 일반적인 비율은 5 % 미만이라고 생각하지만 친구, 동료 등의 브라우징 습관을 관찰하는 것 외에 다른 근거는 없습니다. Apache 로그의 경우 AWStats 만 사용합니다. 적어도 내가 설정 한 방식이 아니라 아무것도 필터링하지 마십시오. 내 사이트 중 하나에서 스크립팅을 실행하지 않고 다른 사이트의 경우 보고서를 더 좋아하기 때문에 Piwik으로 전환했습니다.
Paul

2

Cloudflare 수가 GA보다 훨씬 높은 이유를 이해하는 것은 그리 어렵지 않습니다. 그 이유는 Cloudflare가 중개인이기 때문입니다. 자세히 설명하겠습니다.

누군가 누군가 Cloudflare를 사용하는 웹 사이트를 방문하면 사용자가 Cloudflare에 IP 사용자 에이전트 및 기타 정보와 같은 정보를 요청하는 것을 보냅니다. 따라서 스크립트 차단기 또는 다른 Cloudflare와 같은 확장 프로그램을 사용하는 사용자가 누군가가 귀하의 사이트를 방문했음을 알더라도 문제가되지 않습니다.

왜 숫자가 높습니까? 사이트가 등록 될 때마다 또는 도메인이 Google과 같은 정보를 수집하기 위해 봇을 보내는 정확한 사람이되도록 도메인을 확인할 수 있습니다. 구글이 봇을 보낼뿐만 아니라 다른 많은 것들이 있다는 것을 기억하십시오. Cloudflare가 봇 또는 실제 사람을 알 수있는 방법은 많이 있지만 봇 방문을 분리 또는 제거할지 확실하지 않습니다.

또한 이러한 차별화 조치를 쉽게 속일 수 있습니다.

결론 : 웹 사이트가 요청 될 때마다 총 수에 +1이 추가됩니다.

추가 생각 : 확실하지 않지만 웹 사이트에 .js 또는 .png 또는 다른 파일을 추가하는 경우. 브라우저는 해당 링크를 요청하여 사이트 방문으로 간주 될 수 있습니다. 예 : 한 페이지에 10 개의 사진이 있고 모두로드하는 경우 브라우저는 방문 수를 1에서 11까지 만들 수있는 모든 사진을 개별적으로 요청합니다 (사진의 경우 10, 웹 사이트 HTML의 경우 1).


1

지금까지 Cloudflare Analytics를 본 적이 없지만 실제로는 Analytics보다 Analytics에 더 가깝습니다. Cloudflare는 Google에 비해 순 방문수의 20 배를보고하며 페이지 뷰와 거의 동일합니다.


흥미 롭기 때문에 더 자세히 조사 할 가능성이 있습니까?
CodeMonkey

나는 통나무를 조금 살펴 보았고, 대부분 불일치를 일으키는 봇인 것 같습니다. 그리고 Google 문서 도구에서 실행되는 "업타임"검사기가 5 분마다 사이트를 방문하고 있습니다.
nathangiesbrecht

1

최근에 클라이언트 WP 기반 웹 사이트를 파괴하고 완전히 새로운 웹 사이트를 만들었습니다. 동시에 CF를 새 사이트에 추가했습니다. 그의 오래된 사이트는 계속해서 서버 한도에 도달했습니다. 새 사이트를 만들었을 때 오래된 이미지 URL을 모두 파괴하여 사이트를 방해했습니다. 이제 CF는 GA보다 훨씬 많은 양의 트래픽을보고하며 서버에 대한 bc 요청은 현재 도둑이 이전 이미지를 핫 링크하는 404 이미지가 아니라고 생각합니다. 내 두 센트.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.