다른 답변을 제공하는 베이지안 및 잦은 접근의 예


54

참고 : 나는 나는 알고 철학적 베이지안 및 빈도주의 통계의 차이.

예를 들어 "테이블의 동전이 머리 일 확률은 얼마입니까?"라는 말은 이미 머리 나 꼬리가 착륙 했으므로 잦은 통계에서는 의미가 없습니다. 따라서이 질문은 빈번한 용어로는 답이 없습니다.

그러나 그러한 차이는 특히 내가 요구 하는 차이가 아닙니다 .

오히려, 나는 그들의 예측 방법을 알고 싶습니다 잘 형성 질문에 실제로 차이 , 현실 세계에서 제외 그런 제가 위에서 언급 한 예로서 어떤 이론 / 철학적 차이를.

다시 말해,

잦은 통계 베이지안 통계 모두 에서 대답 할 수있는 질문의 예는 무엇입니까 ?

(예 : 그들 중 하나는 특정 질문에 대해 "1/2"로 대답하고 다른 하나는 "2/3"로 대답합니다.)

그러한 차이점이 있습니까?

  • 그렇다면 몇 가지 예는 무엇입니까?

  • 그렇지 않다면 특정 문제를 해결할 때 베이지안을 사용하는지 아니면 잦은 통계를 사용 하느냐에 따라 실제로 차이가 발생합니까?
    다른 사람을 선호하는 이유는 무엇입니까?


8
John Kruschke는 베이지안과 표준 통계 방법을 비교하는 두 개의 비디오를 제작했습니다. 그는 베이지안 방법은 거부하지만 표준 방법은 그렇지 않은 많은 예를 가지고 있습니다. 아마 당신이 찾고있는 것이 아니라 어쨌든 ... youtu.be/YyohWpjl6KU and youtu.be/IhlSD-lIQ_Y .
Rasmus Bååth

4
N0NN0N

@ Procrastinator : 감사합니다. 지금 언급 한 슬라이드를보고 있습니다. 이것은 내 수학적 배경보다 조금 더 강해 보이지만 희망적으로 뭔가를 얻을 수 있기를 바랍니다. :)
Mehrdad

2
Stone의 예를 살펴볼 수 있습니다. 여기 내 블로그에서 설명합니다 : normaldeviate.wordpress.com/2012/12/08/…
Larry Wasserman

1
@mbq : 왜 이것이 커뮤니티 위키가 되었습니까?
Mehrdad

답변:


9

이 예제는 여기 에서 가져옵니다 . (SO 에서이 링크를 얻었지만 더 이상 찾을 수 없다고 생각합니다.)

n=14k=10θθ

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0)
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Beta(1,1)(10/14)2.51

내가 찾던 정확한 답변 +1, 감사합니다.
Mehrdad

5
실제로 답변에서 참조 된 게시물에 대한 업데이트가있었습니다 ... 그는 이전에 균일 한 분포를 사용하는 대신 게시물을 떠났지만 더 무관심 할 수 있습니다.이 경우 베타 ( 0,0) 이전과 같은 분포. 이러한 분포는 분포의 평균이 동일 할 가능성이있는 경우에 해당합니다.이 경우 베이지안과 빈번한 두 가지 접근 방식은 동일한 결과를 제공합니다. " !!! 따라서 우리는 여전히이 질문에 답할 수있는 예가 필요합니다! 따라서이 질문에 대한 진정한 대답으로 아래 답변에 +1하십시오.
user1745038

10

Edwin Jaynes의 논문에 대해 올바르게 구성된 잦은 신뢰 구간의 예를 제공하는 여기 에서 내 질문을 참조하십시오 . 통계의 실제 값이 신뢰 구간의 어디에도 없음을 확실히 알 수있는 충분한 정보가 샘플에 있습니다. 따라서 신뢰 구간은 베이지안 신뢰할 수있는 구간과 다릅니다.

그러나 그 이유는 신뢰 구간과 신뢰할 수있는 구간의 정의가 다르기 때문에 잦은 빈도와 베이지안 확률의 차이의 직접적인 결과입니다. Bayesian에게 신뢰도가 아닌 Bayesian 신뢰 구간을 생성하도록 요청하는 경우, 구간이 동일한 이전 구간이 항상있을 것으로 예상되므로 차이는 이전 선택에 따라 결정됩니다.

잦은 방법 또는 베이지안 방법이 적절한 지 여부는 제기하려는 질문에 달려 있으며, 하루가 끝나면 답을 결정하는 철학의 차이입니다 (필요한 계산 및 분석 노력이 고려되지 않는 경우).

뺨에 다소 혀가 있기 때문에 장기 빈도는 제안의 상대적인 타당성을 결정하는 완벽하게 합리적인 방법이라고 주장 할 수 있습니다.이 경우 잦은 통계는 주관적 베이지안의 약간 이상한 부분입니다. 주관 론자 베이지안도 같은 방식으로 대답 할 수도 있고 다른 방식으로 다른 방식을 선택할 수도 있습니다. ;영형)


4
"주관적인 베이지안"의 사용은 약간의 자기 파괴적입니다 ( 참조 ). 일반적으로 모델링은 주관주의로 가득 차 있으며, 샘플 모델링을위한 분포의 선택도 주관적입니다. 특정 모델이 합리적인지 확인하기 위해 적합도 테스트의 선택조차 주관적입니다.

2
나는 누군가가 "주관적"을 괄목 할 만하다고 생각한다면, 그것은 그들의 잘못이라는 것에 동의하지 않습니다. 때때로 우리는 확률을 의미 할 때, 실제로 주관적인 개인적 신념을 의미합니다-그것이 그것이 실제로 의미하는 것이라면 (확률의 정의가 순전히 주관적인 선택이기 때문에 장기 빈도 만 받아들이도록 선택하는) 것을 부르지 않을 이유가 없습니다.
Dikran Marsupial

1
링크에 +1 해 주셔서 감사합니다. 또한 신뢰 구간과 신뢰할 수있는 구간의 차이에 대한 참고도 있습니다.
Mehrdad

8

나는이 논문이 실제 응용에서 두 가지 사이의 트레이드 오프에 대해보다 의도적 인 의미를 제공한다고 믿는다. 이 중 일부는 테스트보다는 간격을 선호하기 때문일 수 있습니다.

Gustafson, P. and Greenland, S. (2009). 지저분한 관측 데이터의 구간 추정 . 통계 과학 24 : 328–342.

구간과 관련하여 잦은 신뢰 구간에는 균일 한 범위 (확률이 0이 아닌 각 매개 변수 값마다 x % 이상)가 필요하고 균일하지 않은 적용 범위가 필요하거나 필요하다는 점을 명심해야합니다. 그것들은 정말로 신뢰 구간이 아닙니다. (일부는 더 나아가서 적용 범위를 변경하는 관련 하위 집합도 배제해야한다고 말합니다.)

베이지안 적용 범위는 일반적으로 가정 된 이전의 결과가 정확하다고 가정 할 때 "평균 적용 범위"로 완화하는 것으로 정의됩니다. Gustafson and Greenland (2009)는 이러한 전능 한 사전을 호출하고 더 나은 평가를 제공하기 위해 낙상 가능한 것들을 고려합니다.


1
+1 제한의 차이에 대해 전혀 몰랐습니다. 지적 해 주셔서 감사합니다.
Mehrdad

3

누군가가 빈번한 질문과 베이지안 답변을 모두 가진 질문을 제기한다면, 다른 사람이 질문에서 모호성을 식별하여 "잘 형성되지"않았다고 생각합니다.

즉, 잦은 답변이 필요한 경우 잦은 방법을 사용하십시오. 베이지안 응답이 필요한 경우 베이지안 방법을 사용하십시오. 필요한 것이 무엇인지 모른다면 질문을 명확하게 정의하지 않았을 수 있습니다.

그러나 실제로는 문제를 정의하거나 질문하는 여러 가지 방법이 있습니다. 어떤 방법이 바람직한 지 명확하지 않은 경우가 있습니다. 이것은 고객이 통계적으로 순진 할 때 특히 일반적입니다. 때로는 한 질문이 다른 질문보다 대답하기가 훨씬 어렵습니다. 이 경우 고객이 자신이 묻는 질문이나 해결하려는 문제에 정확하게 동의하도록하기 위해 가장 쉬운 방법을 사용합니다.


3

MacKay 의 무료 이론 교과서 정보 이론, 추론 및 학습 알고리즘의 연습 3.15를 살펴 보는 것이 좋습니다 .

런던 경제 대학원의 통계 강사 인 배리 브라이트 (Bary Blight)는 250 번의 가장자리에서 250 번이나 회전 할 때 벨기에의 1 유로 동전이 140 번이나 110 번 꼬리를 쳤다. `코인이 편향되어 있지 않으면 그 결과가 7 % 미만일 때와 같이 극단적 인 결과를 얻을 수있는 가능성이 있습니다. ' 그러나 이러한 데이터는 동전이 공정하지 않고 편향되어 있다는 증거를 제공합니까?

p0.076:1

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.