카파 ( ) 통계는 Cohen [1]에 의해 1960 년에 도입되어 두 평가자 간의 합의를 측정합니다. 그러나 그 차이는 꽤 오랫동안 모순의 원천이었습니다.
내 질문은 큰 샘플과 함께 사용할 최상의 분산 계산에 대한 것입니다. 나는 Fleiss [2]에 의해 테스트되고 검증 된 것이 올바른 선택이 될 것이라고 생각하는 경향이 있지만, 이것이 옳은 것으로 보이는 (그리고 최근의 문헌 전체에서 사용 된) 유일한 것으로 보이지는 않습니다.
지금은 점근 적으로 큰 표본 분산을 계산하는 두 가지 구체적인 방법이 있습니다.
- Fleiss, Cohen 및 Everitt에 의해 출판 된 올바른 방법 [2];
- 이 책에서 Colgaton, 2009 [4] (106 페이지)에서 찾을 수있는 델타 방법.
이러한 혼란의 일부를 설명하기 위해 Fleiss, Cohen 및 Everitt [2]의 인용문은 다음과 같습니다.
많은 성공을 거두기 전에 여러 번의 인간의 노력이 반복되는 실패로 저주를 받았습니다. 에베레스트 산의 확장이 한 예입니다. 북서 항로 발견은 두 번째입니다. 카파에 대한 올바른 표준 오차를 도출하는 것은 세 번째 입니다.
그래서, 여기에 일어난 일에 대한 작은 요약이 있습니다 :
- 1960 : 코헨 그의 논문 "공칭 스케일 합의 계수를"발행 [1]라는 두 채점자 간의 계약 그의 기회 보정 계수 도입 . 그러나 분산 계산에 잘못된 수식을 게시합니다.
- 1968 : Everitt가 그것들을 바로 잡으려고하지만 그의 공식도 틀 렸습니다.
- 1969 : Fleiss, Cohen 및 Everitt는 논문 "카파 및 가중 카파의 큰 표본 표준 오류"[2]에 올바른 공식을 발표했습니다.
- 1971 : Fleiss 가 동일한 이름으로 다른 통계량 (그러나 다른 통계량)을 공표 합니다.
- 1979 : Fleiss Nee와 Landis는 Fleiss ' 대한 올바른 공식을 발표합니다 .
처음에는 다음 표기법을 고려하십시오. 이 표기법은 합산 연산자가 점이 배치 된 차원의 모든 요소에 적용되어야 함을 의미합니다.
p . j = k ∑ i = 1 p i j
이제 Kappa를 다음과 같이 계산할 수 있습니다.
어느
귀무 가설 하에서 다음과 같이 주어진다.
Congalton의 방법은 분산을 얻기위한 델타 방법을 기반으로하는 것 같습니다 (Agresti, 1990; Agresti, 2002); 그러나 델타 방법이 무엇인지 왜 사용 해야하는지 잘 모르겠습니다. 분산,이 방법에 따라,에 의해 주어진다 :
어느
(Congalton은 대신 아래 첨자를 사용 하지만 같은 것을 의미하는 것 같습니다. 또한 는 계산 행렬, 즉 혼동 행렬을 샘플 수로 나누기 전에 화학식 의해 관련 )
또 다른 이상한 부분은 Colgaton의 책이 Cohen의 원고를 참조하는 것처럼 보이지만 가중 Kappa에 대해 논의하기 전까지는 Fleiss et al이 발표 한 Kappa 분산에 대한 수정 사항을 인용하지 않는 것 같습니다. 아마도 그의 첫 번째 간행물은 kappa에 대한 진정한 공식이 여전히 혼란에서 잃었을 때 작성 되었습니까?
왜 그 차이가 다른지 설명 할 수 있습니까? 또는 왜 누군가가 Fleiss의 수정 된 버전 대신 델타 방법 분산을 사용합니까?
[1] : Fleiss, Joseph L .; 코헨, 야곱; BS, 에버릿; 카파 및 가중 카파의 큰 표본 표준 오차. 심리 게시판, Vol 72 (5), 1969 년 11 월, 323-327. 도 : 10.1037 / h0028106
[2] : 코헨, 야곱 (1960). 공칭 스케일에 대한 일치 계수. 교육 및 심리 측정 20 (1) : 37–46. DOI : 10.1177 / 001316446002000104.
[3] : Alan Agresti, 범주 형 데이터 분석, 2 판. 존 와일리와 아들, 2002.
[4] : Russell G. Congalton 및 Green, K .; 원격으로 감지 된 데이터의 정확성 평가 : 원칙 및 사례, 2 판. 2009.