해커 및 베이지안 A / B 테스트에 대한 확률 적 프로그래밍 에서와 같이 베이지안 방식으로 A / B 테스트를 수행하려고합니다 . 두 기사 모두 의사 결정자가 어떤 기준의 확률에 기초하여 더 나은 변형을 결정한다고 가정합니다 ( 예 : ). 따라서 가 더 낫습니다. 이 확률은 결론을 도출하기에 충분한 양의 데이터가 있는지 여부에 대한 정보를 제공하지 않습니다. 따라서 테스트를 언제 중단해야하는지 명확하지 않습니다.
이 두 바이너리의 RV, 가정합시다 와 , 나는 그것이 가능성을 추정하려는 , 그리고 의 관찰을 기반으로 와 . 또한, 및 후부는 베타-분포 된다고 가정하자 .
및 대한 매개 변수를 찾을 수 있으므로 , 를 샘플링하고 . 파이썬의 예 :
import numpy as np
samples = {'A': np.random.beta(alpha1, beta1, 1000),
'B': np.random.beta(alpha2, beta2, 1000)}
p = np.mean(samples['A'] > samples['B'])
예를 들어 있습니다. 이제 과 같은 것을 원합니다 .
신뢰할 수있는 구간과 베이 즈 요인에 대해 조사했지만 적용 가능한 경우이 사례에 대한 계산 방법을 이해할 수 없습니다. 종료 기준이 양호하도록 이러한 추가 통계를 어떻게 계산할 수 있습니까?