NPS (Net Promoter Score) 결과에서 오차 한계를 어떻게 계산할 수 있습니까?

Wikipedia에서 NPS 계산 방법을 설명하겠습니다 .

순 발기인 점수는 고객에게 0에서 10까지의 평가 척도로 단일 질문을함으로써 얻습니다. 여기서 10은 "매우 가능성이 높고"0은 "아마도 없을 것"입니다. 친구 또는 동료? " 고객의 답변에 따라 고객은 발기인 (9–10 등급), 수동적 (7–8 등급) 및 비도 인 (0–6 등급)의 세 그룹 중 하나로 분류됩니다. 그런 다음 발기인의 비율을 발기인의 비율에서 빼서 순 발기인 점수 (NPS)를 얻습니다. NPS는 -100 (모두가 낙담 한 사람)이거나 +100 (모두가 발기인) 일 수 있습니다.

우리는이 설문을 몇 년 동안 정기적으로 운영해 왔습니다. 매번 수백 개의 응답을받습니다. 결과 점수는 시간이 지남에 따라 20-30 점씩 변했습니다. 어떤 점수 이동이 중요한지 파악하려고합니다.

그것이 너무 어려워지면 계산의 기본에 대한 오차 한계를 파악하는 데 관심이 있습니다. 각 "버킷"(프로모터, 패시브, 디 트랙터)의 오차 한계는 무엇입니까? 어쩌면 점수의 평균 만보고 설문 조사 실행 당 하나의 숫자로 데이터를 줄이면 오차 범위는 어떻습니까? 어디든지 나를 데려 갈까요?

여기에 어떤 아이디어가 도움이됩니다. "NPS를 사용하지 마십시오"를 제외하고 그 결정은 내가 바꿀 수있는 능력 밖에 있습니다!

— 댄 던
소스

답변:

우리는 당신이 무작위로 샘플링한다고 가정되는 인구, 가정, 비율 포함 발기인, 수동 소자, 그리고 냐는와 $p_1$ $p_0$ $p_{-1}$ . 국민 연금을 모델링하기 위해, 라벨 (당신의 인구의 각 구성원에 대해 하나) 티켓의 큰 숫자와 더불어 큰 모자를 작성 상상 발기인에 대한, 수동 소자에 대한, 그리고 비방를 들어, 주어진 비율로, 다음 그리기 그들 중 무작위로. 그만큼 $p_1+p_0+p_{-1}=1$ $+1$ $0$ $-1$ $n$ 샘플 모자).NPS는 작성된 티켓의 평균값입니다. 진정한 는 다음과 같습니다 NPS는 모자의 모든 티켓의 평균 값으로 계산됩니다 기대 값 (또는 기대

실제 NPS의 좋은 추정치는 샘플 NPS입니다. 샘플 NPS에도 기대치가 있습니다. 가능한 모든 샘플 NPS의 평균으로 간주 할 수 있습니다. 이 기대는 실제 NPS와 같습니다. 샘플 NPS 의 표준 오차 는 샘플 NPS가 일반적으로 임의의 샘플과 다른 샘플간에 얼마나 많은지를 측정하는 것입니다. 다행스럽게도 SE를 찾기 위해 가능한 모든 샘플을 계산할 필요는 없습니다. 모자에서 티켓의 표준 편차를 계산하고 나누면 더 간단하게 찾을 수 있습니다. . (샘플이 인구의 상당한 비율 일 때는 약간 조정할 수 있지만 여기서는 필요하지 않습니다.) $\sqrt{n}$

예를 들어, 프로모터, 수동태 및 트랙터 의 모집단을 고려하십시오 . 진정한 NPS는 $p_1=1/2$ $p_0=1/3$ $p_{-1}=1/6$

NPS = 1 \times 1 / 2 + 0 \times 1 / 3 + - 1 \times 1 / 6 = 1 / 3.

$\mbox{NPS} = 1\times 1/2 + 0\times 1/3 + -1\times 1/6 = 1/3.$

따라서 차이 는

\begin{aligned} Var(NPS) & = (1 - NPS)^{2} \times p_{1} + (0 - NPS)^{2} \times p_{0} + (- 1 - NPS)^{2} \times p_{- 1} \\ = (1 - 1 / 3)^{2} \times 1 / 2 + (0 - 1 / 3)^{2} \times 1 / 3 + (- 1 - 1 / 3)^{2} \times 1 / 6 \\ = 5 / 9. \end{aligned}

$\eqalign{ \mbox{Var(NPS)} &= (1-\mbox{NPS})^2\times p_1 + (0-\mbox{NPS})^2\times p_0 + (-1-\mbox{NPS})^2\times p_{-1}\\ &=(1-1/3)^2\times 1/2 + (0-1/3)^2\times 1/3 + (-1-1/3)^2\times 1/6 \\ &= 5/9. }$

표준 편차는 동일한에 대한이의 제곱근입니다 $0.75.$

$324$ $1/3 = 33$ $0.75/\sqrt{324}=$ $4.1$

실제로 모자에있는 티켓의 표준 편차를 모르기 때문에 대신 샘플의 표준 편차를 사용하여 추정합니다. 표본 크기의 제곱근으로 나누면 NPS의 표준 오차를 추정합니다.이 추정치는 오차 한계 (MoE)입니다.

각 유형의 고객이 상당수 (일반적으로 약 5 명 이상)를 관찰하면 표본 NPS의 분포는 보통에 가깝습니다. 이는 일반적인 방식으로 MoE를 해석 할 수 있음을 의미합니다. 특히, 샘플 NPS가 실제 NPS의 1 MoE 내에있을 때의 약 2/3의 시간 및 샘플 NPS가 실제 NPS의 2 개의 MoE 내에있을 것의 시간의 약 19/20 (95 %). 이 예에서 오차 한계가 실제로 4.1 % 인 경우 조사 결과 (샘플 NPS)가 모집단 NPS의 8.2 % 내에 있다고 95 % 신뢰할 수 있습니다.

각 설문 조사에는 자체 오차 한계가 있습니다. 이러한 두 가지 결과를 비교하려면 각각 오류 가능성을 고려해야합니다. 측량 크기가 거의 같을 때, 그 차이 의 표준 오차 는 피타고라스 정리로 찾을 수 있습니다. 제곱의 합의 제곱근을 취하십시오. 예를 들어, 1 년 MoE가 4.1 %이고 다른 1 년 MoE가 3.5 % 인 경우 대략 부근의 오차 한계를 계산합니다. $\sqrt{3.5^2+4.1^2}$

시간이 지남에 따라 많은 설문 조사 결과를 비교할 때 더 많은 분리 된 오차 한계에 대처해야하므로보다 정교한 방법이 도움이 될 수 있습니다. 오차 한계가 모두 매우 유사 할 때, 대략적인 경험의 규칙은 3 개 이상의 MoE를 "유의 한"것으로 간주하는 것입니다. 이 예에서, MoE가 약 4 %를 가리키면 여러 설문 조사 기간 동안 약 12 % 이상의 변경이주의를 기울여야하며 작은 변경은 설문 조사 오류로 유효하지 않을 수 있습니다. 여하튼, 여기에 제공된 분석과 경험 법칙은 일반적으로 설문 조사의 차이점이 무엇을 의미하는지 생각할 때 좋은 출발점을 제공합니다.

당신이 $0$ $0$ $1/\sqrt{n}$ $n$

— 우버
소스

이것은 환상적인 답변이었습니다. 대단히 감사합니다.

— 댄 던

"오류 한계"는 일반적으로 표본에서 추출한 통계에 대한 95 % 신뢰 구간으로 해석되지 않습니까? 즉, 해당 통계의 샘플링 표준 오차 (또는 표준 편차)는 약 1.96입니다. "통계량의 표준 편차"또는 "표준 오류"와 동의어로 오차 한계를 사용합니다.

— 피터 엘리스

감사합니다 @ whuber. 나는 용어가 명확하게 정의되어있는 한 (허티 덤프 티 (Humpty Dumpty) 원칙) 용어에 대해 결코 논쟁하지 않으려 고 노력한다. 내가 가지고있는 유일한 증거는 stats.stackexchange.com/questions/21139/… 에서 내 자신의 질문에 대한 답변 입니다.

— Peter Ellis

@ 찰스, whuber가 이산 랜덤 변수의 기본 분산을하고 있다고 생각합니다.

— B_Miner

V a r = p_{1} + p_{- 1} - N P S^{2}

$Var = p_1 + p_{-1} - NPS^2$

연속 변수에 분산 추정기를 사용할 수도 있습니다. : 공지의 보정 샘플의 분산을 계산 있기 때문에 실제로, I는 이산 랜덤 변수의 편차 추정기에 그것을 원하지 https://en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation 다른 바와 같이, Whubers 용액 인구 공식을 기반으로합니다. 그러나 설문 조사를 진행 중이므로 샘플을 추출한 것이 확실하므로 편향 추정량을 사용하는 것이 좋습니다 (제곱의 합을 n뿐만 아니라 n-1로 나눔). 물론, 표본 크기가 클 경우 바이어스 된 추정량과 바이어스되지 않은 추정량의 차이는 거의 없습니다.

또한 z- 점수 접근법을 사용하는 대신 중간 표본 크기가있는 경우 t- 검정 절차를 사용하는 것이 좋습니다. https://en.wikipedia.org/wiki/Student 's_t-test

@ whuber : 다른 사람들도 그것을 요청했기 때문에 : 임의의 이산 변수 접근 방식에 대한 분산 / SD에 대한 편향되지 않은 샘플 추정기를 어떻게 계산합니까? 나는 그것을 스스로 찾으려고 노력했지만 성공하지 못했습니다. 감사.

— 데첸
소스

부트 스트랩을 사용하여 계산을 단순화 할 수 있습니다. R에서 코드는 다음과 같습니다.

library(bootstrap)

NPS=function(x){
  if(sum(!x%%1==0)>0){stop("Non-integers found in the scores.")}
  if(sum(x>10|x<0)>0){stop("Scores not on scale of 0 to 10.")}
  sum(ifelse(x<7,-1,ifelse(x>8,1,0)))/length(x)*100
}

NPSconfInt=function(x,confidence=.9,iterations=10000){
  quantile(bootstrap(x,iterations,NPS)$thetastar,c((1-confidence)/2, 1-(1-confidence)/2))
}


npsData=c(1,5,6,8,9,7,0,10,7,8,
          6,5,7,8,2,8,10,9,8,7,0,10)    # Supply NPS data
hist(npsData,breaks=11)                 # Histogram of NPS responses

NPS(npsData)            # Calculate NPS (evaluates to -14)
NPSconfInt(npsData,.7)  # 70% confidence interval (evaluates to approx. -32 to 5)

— 케이 자르
소스

R 코드를 전혀 이해하지 못하는 사람이 여전히 당신이 말하려는 것을 따라갈 수있을 정도로 충분히 자세하게 설명하고, 그들이 할 수있을 정도로 충분히 설명하면서 답변을 확장 할 수 있습니까? 그들이 좋아하는 언어로 그것을 구현하는 데 찌르지 않습니까?

— Glen_b-복지 주 모니카