통계 용어에 대한 정육점을 사과하십시오 :) 광고 및 클릭률과 관련된 몇 가지 질문이 있습니다. 그러나 그들 중 어느 것도 나의 계층 적 상황에 대한 나의 이해에 크게 도움이되지 않았습니다.
이와 관련된 질문 이 있습니다. 동일한 계층 적 베이지안 모델의 동등한 표현입니까? 하지만 실제로 비슷한 문제가 있는지 확실하지 않습니다. 또 다른 질문 계층 적 베이지안 이항 모형 에 대한 우선 순위는 초임 계수에 대해 자세하게 설명하지만 솔루션을 내 문제에 매핑 할 수 없습니다
신제품에 대한 온라인 광고가 두 개 있습니다. 광고를 며칠 동안 게재했습니다. 이 시점에서 광고를 클릭하여 클릭이 가장 많은 사용자를 확인했습니다. 클릭 수가 가장 많은 것을 제외하고 광고를 클릭 한 후 사람들이 실제로 구매하는 양을 확인하기 위해 며칠 동안 광고를 실행하도록했습니다. 그 시점에서 광고를 먼저 게재하는 것이 좋은지 알고 있습니다.
매일 두 항목 만 판매하기 때문에 많은 데이터가 없기 때문에 통계가 너무 시끄 럽습니다. 따라서 광고를 본 후 얼마나 많은 사람들이 물건을 구매하는지 추정하기는 어렵습니다. 클릭당 150 회에 한 번만 구매합니다.
일반적으로 말하자면 모든 광고에 대한 전체 통계로 광고 단위 그룹 통계를 부드럽게하여 가능한 한 빨리 각 광고에서 돈 을 잃고 있는지 알아야합니다 .
- 모든 광고가 충분히 구매 될 때까지 기다린다면 너무 오래 걸리기 때문에 파산하게됩니다. 10 개의 광고를 테스트하려면 각 광고에 대한 통계가 충분히 신뢰할 수 있도록 10 배 더 많은 돈을 써야합니다. 그때까지 나는 돈을 잃었을 수도 있습니다.
- 모든 광고에 대해 평균 구매를하면 제대로 작동하지 않는 광고를 쫓아 낼 수 없습니다.
전체 구매율 ( N $ 하위 배포 있습니까? 즉, 각 광고에 대한 데이터가 많을수록 해당 광고에 대한 통계는 더 독립적입니다. 아무도 광고를 클릭하지 않았다면 전 세계 평균이 적절하다고 가정합니다.
어떤 배포판을 선택할까요?
A를 20 번 클릭하고 B를 4 번 클릭 한 경우 어떻게 모델링 할 수 있습니까? 지금까지 이항 분포 또는 포아송 분포가 여기에서 의미가 있음을 알았습니다.
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(그룹 A의 구매율 만 추정합니까?)
그러나 실제로 다음을 계산하려면 purchase_rate | group A
. 그룹 A (또는 다른 그룹)에 적합하도록 두 배포판을 함께 연결하는 방법은 무엇입니까?
먼저 모델을 맞춰야합니까? 모델을 "훈련"하는 데 사용할 수있는 데이터가 있습니다.
- 광고 A : 352 회 클릭, 5 회 구매
- 광고 B : 15 회 클릭, 0 회 구매
- 광고 C : 3519 클릭, 130 구매
그룹 중 하나의 확률을 추정하는 방법을 찾고 있습니다. 그룹에 두 개의 데이터 포인트 만있는 경우 본질적으로 글로벌 평균으로 돌아가고 싶습니다. 나는 베이지안 통계에 대해 약간 알고 있으며 베이지안 추론과 켤레 사전 등을 사용하여 모델링하는 방법을 설명하는 많은 사람들의 PDF를 읽었습니다. 이 작업을 올바르게 수행하는 방법이 있다고 생각하지만 올바르게 모델링하는 방법을 알 수 없습니다.
베이지안 방식으로 문제를 공식화하는 데 도움이되는 힌트에 매우 만족합니다. 실제로 이것을 구현하는 데 사용할 수있는 온라인 예제를 찾는 데 많은 도움이 될 것입니다.
최신 정보:
답변 해 주셔서 감사합니다. 내 문제에 대해 점점 더 많은 것을 이해하기 시작했습니다. 감사합니다! 문제를 좀 더 잘 이해하고 있는지 확인하기 위해 몇 가지 질문을하겠습니다.
따라서 전환이 베타 배포로 배포되고 베타 배포에는 두 개의 매개 변수 및 가 있다고 가정합니다 .B
그들은 이전에 매개 변수 그래서 매개 변수, 하이퍼 파라미터입니까? 결국 베타 수의 매개 변수로 전환 수와 클릭 수를 설정 했습니까? 1
다른 광고를 비교하고 싶을 때 입니다. 해당 수식의 각 부분을 어떻게 계산합니까?
내 생각 가능성이라는, 또는 베타 분포의 "모드"됩니다. 따라서 이며 및 는 내 분포의 매개 변수입니다. 그러나 여기의 특정 및 는 광고 대한 분포에 대한 매개 변수입니다 . 이 경우이 광고에서 발생한 클릭 수 및 전환 수입니까? 아니면 모든 광고에서 몇 번의 클릭 / 전환이 발생 했습니까?α - 1 αβαβX
그런 다음 이전과 곱하면 P (변환)이며, 제 경우에는 Jeffreys 이전이며 정보가 없습니다. 더 많은 데이터를 얻을 때와 마찬가지로 이전이 유지됩니까?
한계 확률 인 나눕니다. 이 광고를 얼마나 자주 클릭 했습니까?
Jeffreys의 이전 사용에서, 나는 0에서 시작하고 내 데이터에 대해 아무것도 모른다고 가정합니다. 그 이전을 "비 정보"라고합니다. 데이터에 대해 계속 배우면서 이전 데이터를 업데이트합니까?
클릭과 전환이 발생하면 배포를 "업데이트"해야한다는 내용을 읽었습니다. 이것은 내 분포의 매개 변수가 변경되거나 이전 변경 사항을 의미합니까? 광고 X 클릭이 발생하면 둘 이상의 배포를 업데이트합니까? 둘 이상의 이전?