등급에 대한 신뢰 구간을 찾는 방법은 무엇입니까?


32

Evan Miller의 " 평균 평점으로 정렬하는 방법 "에서는 신뢰 구간의 하한을 사용하여 평가 된 항목에 대해 합리적인 집계 "점수"를 제안합니다. 그러나 Bernoulli 모델과 함께 작동합니다. 등급은 엄지 손가락 또는 엄지 손가락입니다.

항목의 등급 수가 적을 경우, 별표 에 ~ 별점 을 부여하는 등급 모델에 사용할 합리적인 신뢰 구간은 무엇입니까 ?K1k

나는 Wilson과 Agresti-Coull 간격의 중심을 다음과 같이 조정하는 방법을 볼 수 있다고 생각합니다.

p~=i=1nxi+zα/22p0n+zα/22

여기서 또는 모든 항목에 대한 평균 등급입니다. 그러나 간격 너비를 조정하는 방법을 잘 모르겠습니다. 내 (수정 된) 최선의 추측은p0=k+12

p~±zα/2n~i=1n(xip~)2+zα/2(p0p~)2n~

함께 하지만 같은 것을 고려 Agresti-Coull의 유추로 손을 흔들며 I보다 더으로 정당화 할 수없는n~=n+zα/22

Estimate(X¯)±zα/2n~Estimate(Var(X))

적용되는 표준 신뢰 구간이 있습니까? (저는 저널을 구독하거나 대학 도서관에 쉽게 접근 할 수 없습니다. 반드시 적절한 참고 자료를 제공하지만 실제 결과를 보충하십시오!)


4
현재 답변 이이 문제를 중심으로 (아마도 예의를 잃었을 수 있음) 있기 때문에이 응용 프로그램은 끔찍한 신뢰 한계 남용임을 지적하고 싶습니다. 평균을 순위 화하기 위해 LCL을 사용하는 것에 대한 이론적 근거는 없습니다 (그리고 LCL이 순위 목적으로 평균보다 실제로 나쁜 이유는 많이 있습니다). 따라서이 질문은 잘못 결함이있는 접근 방식을 전제로하여 상대적으로 관심을 끌지 못한 이유 일 수 있습니다.
whuber

2
이 특정 질문의 좋은 특징은 실제 질문을 무시하고 더 중요한 근본적인 질문에 초점을 맞출 수있는 충분한 컨텍스트를 포함한다는 것입니다.
Karl

1
변경된 제목을 원하는대로 수정했습니다, Peter. 내가 처음 편집 한 내용은 자 급식이 아니라 제목이 질문의 내용을 반영하도록하기위한 것입니다. 당신은 당신이 정말로 의미하는 바에 대한 최종 중재자입니다.
whuber

답변:


23

칼 브로 만 (Karl Broman)의 답변 에서처럼 베이지안 접근 방식은 신뢰 구간을 사용하는 것보다 훨씬 낫습니다.

신뢰 구간 문제

신뢰 구간을 사용하는 것이 왜 제대로 작동하지 않을 수 있습니까? 한 가지 이유는 항목에 대한 평가가 많지 않으면 신뢰 구간이 매우 넓어 신뢰 구간의 하한이 작기 때문입니다. 따라서 많은 평가가없는 항목은 목록 하단에 나타납니다.

그러나 직관적으로 많은 평가가없는 항목이 평균 항목에 가깝게되기를 원하므로 모든 항목에 대한 평균 평가쪽으로 항목의 예상 평가를 흔들어야합니다 (예 : 예상 평가를 이전 으로 푸시하려는 경우 ). . 이것이 바로 베이지안 접근 방식입니다.

베이지안 접근법 I : 등급에 대한 정규 분포

Karl의 답변에서와 같이 추정 된 등급을 이전으로 이동시키는 한 가지 방법은 형식의 추정값을 사용하는 것입니다 .wR+(1w)C

  • R 은 항목에 대한 등급 이상의 평균입니다.
  • C 는 모든 항목에 대한 평균입니다 (또는 이전에 등급을 축소하려는 항목).
  • 공식은 과 의 가중치 조합입니다 .CRC
  • Rvmw=vv+m 은 할당 된 가중치입니다 . 여기서 는 맥주에 대한 리뷰 수이고 은 일정한 "임계 값"매개 변수입니다.Rvm
  • 참고 그 때 우리가 현재 항목에 대한 평가가 많이있을 때 즉, 다음, 매우 큰 우리의 추정 평가가 매우 가까운 그래서, 매우 가까운 1 인 우리가 이전에 거의 관심을 지불 . 그러나 가 작 으면 는 0에 매우 가까우므로 추정 된 등급은 이전 에 많은 가중치를 부여합니다 .w R C v w CvwRCvwC

실제로이 평가는 개별 평가가 해당 평균을 중심으로 하는 정규 분포 에서 비롯 될 때 항목의 평균 평가의 사후 추정으로 베이지안 해석으로 제공 될 수 있습니다 .

그러나 등급이 정규 분포에서 나온다고 가정하면 두 가지 문제가 있습니다.

  • 정규 분포는 연속적 이지만 등급은 개별적 입니다.
  • 아이템의 등급이 반드시 단봉 형 가우스 모양을 따르는 것은 아닙니다. 예를 들어, 항목이 극도로 편광되어 있기 때문에 사람들은 매우 높은 등급을 받거나 매우 낮은 등급을주는 경향이 있습니다.

베이지안 접근 II : 등급에 대한 다항 분포

따라서 등급에 대한 정규 분포를 가정하는 대신 다항 분포를 가정 해 봅시다 . 즉, 특정 항목이 주어지면 임의의 사용자가 1 개의 별을 줄 확률 , 임의의 사용자가 2 개의 별을 줄 확률 등이 있습니다.p 2p1p2

물론 우리는 이러한 확률이 무엇인지 전혀 모릅니다. 이 항목에 대한 평가가 점점 이 가깝다고 추측 할 수 있습니다 . 여기서 은 별표 1 개를 준 사용자 수이고 은 별표 가 표시된 총 사용자 수입니다. 처음 시작할 때는 아무것도 없습니다. 따라서 이러한 확률에 Dirichlet prior 를 배치합니다.n 1p1 n1nDir(α1,,αk)n1nn1n Dir(α1,,αk)

이 Dirichlet은 무엇입니까? 우리는 각 생각할 수있는 일부 가상 사람이 항목을 준 횟수의 "가상 수"있다고 매개 변수 별을. 예를 들어, , 이고 다른 모든 가 0이면 두 명의 가상 인물이 1 개의 별표를, 한 명의 가상 인이 2 개의 아이템을 주었다고 생각할 수 있습니다. 별. 따라서 실제 사용자를 확보하기 전에이 가상 배포를 사용하여 항목의 등급을 추정 할 수 있습니다. i α 1 = 2 α 2 = 1 α iαiiα1=2α2=1αi

[선택하는 한 가지 방법 매개 변수를 설정하는 것 의 투표의 전체 비율과 동일 별. ( 매개 변수는 반드시 정수일 필요는 없습니다.]]α i i α iαiαiiαi

그런 다음 실제 등급이 나오면 이전에 Dirichlet의 가상 개수에 해당 개수를 추가하기 만하면됩니다. 아이템의 등급을 추정 할 때마다 모든 아이템의 등급 (가상 등급과 실제 등급 모두)의 평균을 취하십시오.


1
접근법 2는 접근법 1과 동일하게 작동하지만 그렇지 않습니까?
피터 테일러

2
@ 피터 : 아, 맞아요! 당신이 그것을 언급 할 때까지 그것을 몰랐습니다 =). (당신이하고 싶은 모든 것이 후자의 평균을 취하는 것이라면, 그것들은 동일합니다. Dirichlet 후부를 갖는 것이 다른 종류의 점수, 예를 들어 어떤 종류의 극성 측정을 계산하려는 경우 유용 할 수 있습니다.
raegtin

1
접근법 1에서는 일반적으로 어떻게 선택 합니까? m
Jason C

15

이 상황은 베이지안 접근 방식을 요구합니다. 베이지안 순위의 등급에 대한 간단한 접근 방법이 여기에 있으며 (관심있는 의견에 특히주의를 기울임) 여기에 여기 에 대한 추가 논평이 있습니다 . 이 링크 중 첫 번째 주석 중 하나에서 지적한 것처럼 :

최고의 맥주 대변인 (BA)은 베이지안 추정치를 사용합니다.

가중 순위 (WR) = (v / (v + m)) × R + (m / (v + m)) × C

여기서 :
R = 맥주에 대한 리뷰 평균
v = 맥주 에 대한 리뷰 수
m = 나열해야하는 최소 리뷰 (현재 10)
C = 목록 전체의 평균 (현재 2.5)


2
Beer Advocate 방법의 단점은 변동성을 고려하지 않는다는 것입니다. 그럼에도 불구하고, 나는이 사고 방식을 신뢰 하한 아이디어보다 선호한다.
Karl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.