쿠키와 방문자의 표준 비율은?


31

A의 언급 한 바와 같이 최근 블로그 게시물 , 우리가 볼 Google 웹 로그 분석 "방문자"와 Quantcast 돌아 "방문자"사이에 큰 차이를.

또한 Google 웹 로그 분석에서 아직까지 파악하지 못한 이유로 Google 웹 로그 분석은 Quantcast보다 더 큰 숫자를 얻습니다. 현재 GA는 Quantcast가 전체 네트워크 (1400 만) 에서 보는 것보다 stackoverflow.com에서만 더 많은 방문자 (1,500 만)를 보여줍니다 .

왜? 모르겠어요 Google 애널리틱스에서 쿠키가 손실되거나 Quantcast가 방문자를 그리워합니다. 계산은 부정확 한 과학입니다.

Quantcast는보다 보수적 인 쿠키 대 방문자 비율을 사용 하기 때문이라고 생각 합니다 . Google Analytics는 모든 쿠키를 "방문자"로 간주하지만 Quantcast는 모든 1.24 쿠키 만 "방문자"로 간주합니다. 사람들이 여러 컴퓨터, 여러 브라우저 등에서 사이트에 액세스 할 수 있기 때문에 이것은 나에게 의미가 있습니다.

두 가지 밀접한 관련 질문이 있습니다.

  1. 방문자에게 허용되는 쿠키의 표준 비율이 있습니까? 이것은 분명히 부정확 한 과학이지만, 새로운 경험 법칙이 있습니까?

  2. 브라우저 쿠키에 의존하는 것 이외의 웹 사이트에 "방문자"를 계산하는 더 정확한 방법이 있습니까? 또는 측정 방법에 관계없이 항상 최선의 노력으로 추정되는 문제일까요?


Quantcast는 쿠키를 사용합니다. 그들은 단지 IP 주소 나 다른 것에 가지 않습니까?
DisgruntledGoat

@disgruntledgoat 방금 웹 사이트를 확인했습니다. "Quantcast는 고유 한 쿠키 수와 사람에 대한 잠재 고객 데이터를 제공합니다."
Matthew Brookes

@DisgruntledGoat이 페이지를 확인하십시오. 의 쿠키가 있습니다 quantserve.com.
Yahel

답변:


14

Quantcast는 저에게 이메일을 보냈습니다 :

GA 번호와 QC 번호 사이에는 상당한 차이가 있다고 언급했습니다. 이것은 자주 발생하지 않지만 발생하며 몇 가지 이유가 있습니다. 예를 들어 Google은 타사 쿠키 및 자동 새로 고침을 설명하지만 GA는 그렇지 않습니다. 또한 게시자는 MRC 및 IAB 표준을 준수하기 위해 페이지 하단에 태그를 배치해야합니다. 다른 측정 태그가 페이지에서 더 높은 경우 Quantcast가 그렇지 않으면 실행될 수 있습니다. (우리는 유일한 MRC 공인 교통 측정 서비스입니다). 또한 시간대 고려 사항으로 인해 숫자가 정확히 동일하지는 않습니다. 정규화 기능을 사용하고 GA가 고정되어 있습니다.

우리가 우리의 숫자를 결정하는 방법에 대해 더 알고 싶다면 http://www.quantcast.com/how-we-do-it 를 확인 하십시오 . 쿠키 수정 고객 데이터 및 방법론에 대한 백서도 있습니다.

백서를 살펴보면 실제로 Jeff가 제안한대로 수행 할 수 있습니다. "공식적인"숫자를 모아서 실제 사람들과 더 가까운 것으로 생각되는 것을 얻습니다. 그들은이 쿠키 수정 대상 백서 (PDF 링크) 자신의 시스템이 아니라 단지 마법의 번호로 나누어 단순하게, 정교하게되어 있음을 의미한다 :

Quantcast Quantified Publisher 프로그램은 매달 14 억 개 이상의 쿠키 (2008 년 6 월 현재의 데이터)에 의해 생성 된 750 억 건 이상의 미디어 소비 이벤트를 캡처합니다. 또한 많은 Quantified Publisher 파트너가 쿠키와 독립적 인 익명 식별자를 당사와 공유합니다. 이 모델에는 쿠키 삭제가없는 사람 기반 기준점 및 보정을 제공하는 여러 패널이 포함되어 있습니다. 우리는 다양한 수집 프로세스, 편향 및 문제로 이러한 대량의 데이터를 삼각 측량합니다. Google의 모델은 방문 빈도, 기간, 여러 컴퓨터 사용 가능성 및 동일한 컴퓨터를 사용하는 여러 사람들이 영향을 받아 사람들 기반 추정치를 제공합니다. 고유 쿠키를 사람에게 번역하기위한 당사의 모델은 홀드 아웃 샘플과 독립적 인 데이터 세트를 사용하여 검증되었습니다. 또한, 우리의 모델은 진화하고있는 인터넷 트래픽 패턴의 본질을 반영하기 위해 지속적으로 역동적이고 재 교정됩니다.


2
흥미 롭군 후자의 발췌는 첫 번째보다 더 유익하고 설득력이 있습니다. GA는 자사 쿠키를 사용하므로 타사 쿠키를 고려할 필요가 없습니다. 그렇습니다. 시간대 차이는 정확한 숫자를 변경하지만 한 달에 걸친 긴 기간은 중요한 측정 차이를 설명 할 가능성이 거의 없습니다.
Yahel

27

Quantcast에서 과소 평가되는 또 다른 요소는 다음과 같습니다. 타사 쿠키 ( .quantserve.com도메인 에서 제공 한 쿠키 )를 사용하는 반면 Google Analytics는 타사 쿠키 ( stackexchange.com등)를 사용합니다.

일부 브라우저 (특히 Safari, 최근 Firefox 및 Chrome)는 타사 쿠키를 기본 설정으로 사용하지 않도록 설정하고 다른 브라우저는 타사 쿠키를 차단하는 개인 정보 설정을 개별적으로 선택할 수 있으므로 매우 중요합니다. 이것은 QuantCast의 쿠키에 의해 추적되지 않는 인구 집단이 있다는 것을 의미합니다. 본질적으로 이는 Google Analytics가 항상 더 많은 방문자 수를 반환한다는 것을 의미합니다.

나는 경험 법칙이 없다고 말하고 싶습니다. 분석 전문가로서 '진정한'방문자 수에 대한 탐구는 희망이 없으며 방문 자체에 중점을두고 있습니다. 예를 들어 Google 애널리틱스 계정의 경우 최소 8 명의 방문자이며 내 업무용 노트북, 개인용 노트북, 휴대 전화 및 iPad의 Chrome, Safari 및 Firefox에서 StackOverflow에 액세스했습니다. 분석 서비스는 모두 다른 방식으로 계산되므로 크게 다른 숫자를 반환합니다.

완벽하게 구현하더라도 Google 웹 로그 분석은 거의 항상 서버 로그 기반 분석 시스템보다 방문수가 적지 만 Quantcast와 같은 타사 쿠키 기반 시스템보다 방문수가 더 많습니다. 중요한 것은 원시 합계를 보는 것이 아니라 각 방법의 강점에서 보여주는 추세입니다. 따라서 Quantcast 숫자를 Google Analytics 숫자와 비교하지 마십시오. 대신, 수집 된 컨텍스트 내에서 숫자를 사용하십시오.

또 다른 문제는 Google 애널리틱스 구현이 정확하지 않을 수 있습니다. 여러 도메인 및 하위 도메인 설정에 맞게 구성하는 것이 정확하고 엄격하게 수행되지 않으면 악몽이 될 수 있기 때문에 단일 브라우저로 계산 될 수 있습니다. 다수 방문자, 그 자체가 당신의 수를 팽창. 모든 쿠키가 제 3 자 도메인에 설정되어 있으므로 Quantcast에서는 문제가되지 않습니다.


Chrome은 기본적으로 타사 쿠키를 차단하는 것으로 보입니다.
MrWhite

7

순 방문자 수에 대한 쿠키의 비율은 일반적으로 방문수가 백만 회 이상인 사이트의 경우 1.3에서 1.7 사이입니다.

yc01은 GA가 자사 쿠키와 타사 쿠키를 사용하는 것이 맞지만 RealSelf.com에서는 2 개의 자사 분석 제공 업체 (GA 및 Comscore Direct)를 사용하며 GA는 여전히 Comscore의 고유 방문자보다 30 % 더 많은 절대 고유 방문자를 보여줍니다.

Comscore는 국가별로 순 방문자수 만 표시하므로 GA를 Comscore와 비교하려면 다음과 같이 미국 기반 절대 순 방문자수를 계산해야합니다.

미국 방문 / 전역 방문 * 절대 고유 사용자

(1,150,110 / 1,650,979) * 1,273,059 = 886,842 미국 기반 순 사용자

반면 Comscore는 680,900 명의 미국 기반 순 사용자를보고합니다. 따라서 GA는 30.2 % 더 많이 표시합니다.

Comscore는 정확성을 추구하기 위해 비즈니스를 구축했으며 GA는 주로 애드워즈와 애드 센스를 사용하는 사이트를 추적하고 최적화하는 무료 방법입니다. Comscore에는 트래픽을 추정하는 데 사용하는 사람들의 패널이 있으며이 패널을 사용하여 한 사람당 평균 쿠키 수를 결정합니다. 모바일 장치를 사용하는 사람이 많아 질수록 (모바일 사용량이 15 % 임) 고유 쿠키는 고유 사용자 수를 과장하는 것이 합리적입니다.


"순 방문자수에 대한 쿠키 비율은 일반적으로 방문수가 백만 회 이상인 사이트의 경우 1.3 ~ 1.7입니다." 이것이 Comscore가 공개 한 수치입니까?
Ciaran

이것은 놀랍게도 우리에게 정확합니다. UserSession몇 사이트 에서 테이블 통계를 실행했으며 2.0 (스택 오버플로)에서 1.46 (webapps.se) 사이의 다른 모든 범위를 포함합니다. 1.6은 기술 중심 사이트의 경우 매우 기본 인 것처럼 보입니다.
Jeff Atwood

4

다음은 다른 시장에 대한 "쿠키 인플레이션 승수"에 대한 MediaMind의 최근 (2011 년 5 월 4 일-어제 작성했을 때) 연구입니다.

계산 된 인플레이션 계수는 독일의 경우 2.2에서 미국의 경우 3.0 사이입니다.


이것은 훌륭하다 – 내가 찾던 참고의 종류
Jeff Atwood

2

잠재 고객의 기술적 특성으로 인해 GA 방문자 수가 일반 사이트보다 더 부 풀릴 수 있습니까? 예를 들어, 웹 개발자, 특히 프로그래머는 다양한 브라우저를 사용하여 쿠키 수를 늘리는 경향이 있습니다.

질문 1의 경우 많은 측정 항목과 마찬가지로 집계가 잘못 될 수 있으므로 글로벌 표준을 찾는 대신 자신의 사이트의 데이터를 사용하는 것이 좋습니다. 실제 방문자 수에 쿠키를 얻는 한 가지 방법은 등록 된 각 사용자에게 표시되는 쿠키 수를 계산 한 다음 그 수를 얻는 것입니다.

숫자 2의 경우 이론적으로 실제 방문자 수를 계산하는 가장 좋은 방법은 모든 사람이 계정을 등록하도록하는 것입니다. 분명히 좋은 생각은 아니므로 정규화를 볼 수 있습니다. 예를 들어 위에서 제안한 등록 된 사용자 측정 항목에 평균 쿠키를 사용하여 GA가보고하는 방문자 수에 적용 할 수 있습니다.


이것은 좋은 점입니다. 스택 오버플로에는 현재 531,484 개의 세션이 있으며이 중 261,547 개는 순 사용자를 가리 키므로 기본적으로 1 명의 사용자 당 2 개의 쿠키가 사용됩니다.
Jeff Atwood

-1

나는 IP가 신뢰할 수 있다고 생각합니다 ... 파이썬으로 GA와 같은 통계 시스템을 만들 때 이와 같은 방법을 사용합니다

  • 쿠키를 브라우저로 보내고 모든 에이전트 데이터를 데이터베이스로 가져옵니다
  • 새로운 방문에 쿠키가있는 경우 쉬운 방법은 새로운 방문이 아니므로 새로운 방문이 아닌 것으로 저장하십시오 (또한 사용자가 2 시간 후에 방문 사이트를 반복하면 새로운 방문을 찾기 위해 날짜와 지연 시간을 지정했습니다)
  • 이 사용자 및 IP 및 쿠키에 대한 사용자 IP 및 일부 ID 저장 (쿠키에도 저장)
  • 새로운 사용자가 와서 쿠키가 없습니다 ...이 IP가 새로운가요? 예? 새 사용자 만 사용자 에이전트와 IP / 아니요를 가져옵니다. 이 사용자는 몇 번이나 오나요? 한도 이상? 이 새로운 사용자 에이전트가 아닌 새로운 방문이 아닌가? OK 이것은 새로운 것입니다 ... : D

이 방법에는 결함이 있지만 나쁘지 않고 거의 유효하지 않은 데이터가 있습니다 ...


5
예를 들어 NAT 뒤에서 StackOverflow에 액세스하는 여러 개발자가있는 회사를 어떻게 처리 할 수 ​​있습니까? 모두 한 명의 방문자로 간주됩니까?
Svish

3
이것의 IP 측면은 실제로 결함이 있습니다. IP 주소는 고유 식별자가 아닙니다.
Yahel

이것에 대한 시도 시간이 있습니다 ... 우리는 에이전트와 다른 것들을 확인하고 우리는 하나의 IP를 100 배 이상 추가 할 수 있습니다 ... NAT 뒤에 실제 사용자를 찾는 제안 된 방법
Mohammad Efazati
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.