표본 크기와 후방에 대한 이전의 영향 사이의 관계는 무엇입니까?


17

표본 크기가 작 으면 이전 분포가 후방 분포에 많은 영향을 미칩니 까?


5
직관이 명확합니다. 데이터가 많을수록 이전에 의존 할 필요가 줄어 듭니다. 통계 레슨뿐만 아니라 인생 레슨! ;)
Lucas Reis 2016 년

답변:


27

예. 데이터 세트 X 가 주어지면 매개 변수 의 사후 분포는 다음과 같이 쓸 수 있습니다.θX

p(θ|X)p(X|θ)likelihoodp(θ)prio아르 자형

또는 로그 스케일에 더 일반적으로 표시되는 것처럼

log(p(θ|X))=c+L(θ;X)+log(p(θ))

로그 우도, , 샘플 크기 비늘 종래 밀도는하지 않지만 그 데이터의 함수이기 때문에. 따라서 표본 크기가 증가함에 따라 log ( p ( θ ) ) 가 고정 된 상태 (고정 값 θ ) 를 유지 하는 동안 L ( θ ; X ) 의 절대 값 이 커지고 , 따라서 합 ( L) ( θ ; X )L(θ;X)=log(p(X|θ))L(θ;X)log(p(θ))θ 는표본 크기가 증가함에 따라 L ( θ ; X )의 영향을 더 많이받습니다.L(θ;X)+log(p(θ))L(θ;X)

따라서 귀하의 질문에 직접 대답하기 위해-이전 분포는 우도에 의해 더 중요 해짐에 따라 점점 더 관련성이 떨어집니다. 따라서 작은 표본 크기의 경우 이전 분포가 훨씬 더 큰 역할을합니다. 이는 반증에 사용할 수있는 데이터가 많지 않을 때 이전 사양이 더 큰 역할을 수행 할 것으로 예상되는 반면, 샘플 크기가 매우 큰 경우 데이터에 존재하는 신호가 우선 순위보다 더 중요 합니다. 신념은 모델에 넣어졌다.


6
+1 또한 n에 의존합니다 . cn

20

다음은 매크로의 우수 (+1) 답변에서 마지막 단락을 설명하려는 시도입니다. 이 파라미터에 대한 두 전과 도시 에있는 B N O m 내가 L ( N , P ) 분포. 몇 가지 다른 n의 경우 , x = n / 2 가 관측 될 때 사후 분포가 표시됩니다 . 마찬가지로 N이 증가 모두 포스 테리어 점점 주위에 집중되어 1 / 2 .pBinomial(n,p)nx=n/2n1/2

n=2n=50

Beta(1/2,1/2)Beta(2,2)

사후 분포

n=50


4
@ MånsT 매우 멋진 삽화. 귀하의 답변에 '베타'와 '바이 노미 알'이라는 단어를 사용 중지했습니다.
Macro

물론, @Macro! 나는 이것이 더 좋아 보인다는 것에 동의합니다.
MånsT 2016 년
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.