나는 최근에 두 분포 사이의 거리 가 평균이 아닌 거리를 기반으로 한 "등가 테스트"방법에 대해 생각 했습니다.
두 가우스 분포 의 중첩 에 대한 신뢰 구간을 제공하는 몇 가지 방법이 있습니다 .
O(P1,P2)P1P2
1−O(P1,P2)=TV(P1,P2)
P 1 P 2TV(P1,P2)=supA∣∣P1(A)−P2(A)∣∣P1 및 .
P2
즉, 예를 들어, 수단 다음 에 의해 주어진 확률 및 어떤 이벤트 이상 다르지 않다 . 대략, 두 분포는 동일한 예측을 최대 만듭니다.P 1 P 2 0.1 10 %O(P1,P2)>0.9P1P20.110%
따라서 고전 동등성 검정에서 와 같이 평균 과 사이의 차이에 대한 임계 값을 기반으로 허용 기준을 사용하는 대신 , 우리는 다음에 의해 제공된 예측 의 확률 차이에 대한 임계 값을 기반으로 할 수 있습니다. 두 분포.μ 2μ1μ2
기준의 "객관성"측면에서 이점이 있다고 생각합니다. 의 임계 값 실제 문제의 전문가에 의해 주어져야합니다. 이것은 그 차이가 실질적으로 중요한 가치가 있어야합니다. 그러나 때로는 실제 문제에 대한 확실한 지식을 가진 사람이 없으며 중요한 가치를 제공 할 수있는 전문가가 없습니다. 에 대한 기존의 임계 값을 채택하는 것은 고려중인 물리적 문제에 의존하지 않는 기준이 될 수 있습니다.T V ( P 1 , P 2 )|μ1−μ2|TV(P1,P2)
분산이 동일한 가우시안 경우 중첩은 표준화 된 평균 차이 와 일대일로 관련됩니다 .|μ1−μ2|σ