우리는 베이지안 통계 테스트를 조사하고 있으며 이상한 현상을 겪고 있습니다.
다음과 같은 경우를 고려하십시오. A 또는 B 인구가 어느 전환율이 더 높은지 측정하는 데 관심이 있습니다. 온 전성 검사의 경우 설정합니다 . 즉, 변환 확률이 두 그룹에서 동일합니다. 이항 모델을 사용하여 인공 데이터를 생성합니다. 예 :
그런 다음 베이지안 베타 이항 모델을 사용하여 p_A, p_B 를 추정하려고 시도합니다 . 예를 들어
테스트 통계는 몬테 카를로를 통해 를 계산하여 계산 됩니다.
라면 S \ sim \ text {Uniform (0,1)} 이라는 사실에 놀랐습니다 . 내 생각은 샘플 크기 이 커짐에 따라 0.5에 집중하고 심지어 0.5로 수렴 할 것이라는 생각이었습니다 .
제 질문은 p_A = p_B 일 때 왜 S \ sim \ text {Uniform (0,1)} 입니까?
다음은 시연 할 몇 가지 Python 코드입니다.
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R