비율 및 이진 분류기 테스트


10

부품을 생산하는 프로토 타입 머신이 있습니다.

첫 번째 테스트에서 기계는 부품을 생산 하고 이진 분류기는 d 1 부품에 결함이 있음을 알려줍니다 ( d 1 < N 1 , 일반적으로 d 1 / N 1 < 0.01N 110 4 ) 및 N 1 - d 1 부품이 좋습니다.N1d1d1<N1d1/N1<0.01N1104N1d1

그런 다음 기술자는 결함있는 부품 수를 줄이기 위해 기계를 약간 변경합니다.

두 번째 테스트 후 수정 된 기계는 부품을 생산 하고 동일한 이진 분류기 (손질되지 않음)는 d 2 부품에 결함이 있음을 알려줍니다 .d 2 / N 2d 1 / N 1 과 매우 유사합니다 .N2d2d2/N2d1/N1

기술자는 자신의 변경 사항이 효과적인지 알고 싶습니다.

분류 기가 완벽하다고 가정하면 (민감도는 100 %이고 특이도는 100 %입니다), 비율 테스트를 수행 할 수 있습니다 (R을 사용하여 입력 prop.test(c(d1,d2),c(N1,N2))).

그러나 분류 기가 완벽하지는 않으므로 기술자에게 올바르게 대답하기 위해 분류 자의 민감도와 특이도를 어떻게 고려할 수 있습니까?


분류기의 정확도를 확인할 수 있습니까?
Michelle

@Michelle 나는 오류 d 2 없이 알고 있지만 결함이있는 부품이 얼마나 잘 분류되어 있는지 알 수 없습니다. d1d2
Alessandro Jacopson

다시 안녕. 가양 성 비율을 추정하기 위해 N1 및 N2에서 우수 부품을 무작위로 무작위 추출 할 수 있습니까?
Michelle

1
이 정보와 함께이 방법을 사용하여 변경 사항을 비교할 수 있습니까? onlinelibrary.wiley.com/doi/10.1002/sim.906/abstractncbi.nlm.nih.gov/pubmed/18224558 및 기타 아이디어는 여기를 참조하십시오 .
Michelle

2
(+1) 이것은 좋은 질문입니다!
steffen

답변:


4

그래서 나는 이것을 첫 번째 원칙에서 이끌어 냈으므로 정확하지 않습니다. 내 생각은 다음과 같습니다.

편집 : 이것은 바로 전에 아니었다. 업데이트했습니다.

  1. 가 실제 양의 양수 d 1^ d 1 이라고 부르는 이진 분류기에 의해 출력 된 숫자 사이의 예상되는 차이를 나타내 도록합시다 . 알려진 레이블이있는 세트에서 분류기를 실행하여이를 측정 할 수 있습니다. 분류기에 의해 생성 된 긍정 수에서 실제 긍정 수를 빼고 N 으로 나누면 α가 됩니다.αd1d1^Nα

  2. 따라서 불량 부품의 실제 비율에 대한 포인트 추정치는 다음과 같이 주어집니다 : d1N1^=d1+αN1N1

  3. d2N2^=d2+αN2N2

  4. p=p1N1+p2N2N1+N2d1N1^d2N2^p=d1+d2+α(N1+N2)N1+N2

  5. p(1p)(1N1+1N2)

  6. z=d1N1d2N2se

해석에 대한 몇 가지 생각 :

  • p<0

  • 이것에 대해 생각하는 또 다른 방법은 결함있는 부품의 수가 분류기의 오차 한계 내에 있으면 차이가 있는지 여부를 알 수 없다는 것입니다. 부품에 결함이 있는지 여부조차 알 수 없습니다!

α

  • αα

h

  • 경험적으로 계산h2ααh2lowl,lowr)(highl,highr)α(highl,lowr) (이전 간격을 둘 다 포함) 비율의 차이에 대해 (1-h) * 100 % CI 여야합니다.

α


+1 감사합니다. 6에서 당신은 "정적"을 썼습니다. "통계"를 의미 했습니까?
Alessandro Jacopson

p<00<p<10<p<1

0.01(N1d1)100β=7100ββprop.test(7,100)

@uvts_cvs 네, "통계적"이어야합니다. 잠시 후 해결하겠습니다. 표준 오차 계산에는 오타가 있으며 대신 p * (1-p) 여야합니다. 분류자가 실제로 나쁘고 d가 큰 경우를 제외하고 P는 항상 <1이어야합니다. 세 번째 의견에 대해서는 그렇습니다. 그 추정치를 모형에 어떻게 통합시키는 지 잘 모르겠습니다. 여기 다른 사람이 알고 있습니까?
John Doucette

αβ
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.