평범한 영어로 베이지안과 잦은 추론


339

베이지안을 빈번한 추론과 구별하는 특징을 일반 영어로 어떻게 설명 하시겠습니까?


두 개의 데이터 세트가있을 때 개별 보울 플레이어에 대한 추론을 그리는 것에 대한 이 질문 -다른 플레이어의 결과와 새로운 플레이어의 결과는 내 대답이 평범한 영어로 해결하려고 시도하는 차이점의 좋은 예입니다.
피터 엘리스

4
아마 여러분 중 일부는 철학 .stackexchange.com 에서 요청되는 베이지안 및 잦은 해석에 대한 질문에 대한 답변을 제공 할 수도 있습니다 .
Drux

답변:


197

할머니와의 기본적인 차이점을 설명하는 방법은 다음과 같습니다.

집 어딘가에 내 휴대 전화를 잘못 놓았습니다. 악기 바닥에있는 전화 로케이터를 사용하여 전화를 찾을 수 있으며 전화 로케이터를 누르면 전화 음이 울립니다.

문제점 : 집에서 어느 지역을 검색해야합니까?

빈번한 추론

전화 음이 들립니다. 또한 사운드가 나오는 영역을 식별하는 데 도움이되는 정신 모델도 있습니다. 따라서 경고음이 들리면 전화를 찾기 위해 검색해야하는 집 지역을 추측합니다.

베이지안 추론

전화 음이 들립니다. 이제는 소리가 나오는 영역을 식별하는 데 도움이되는 정신 모델 외에 과거에 전화를 잘못 놓은 위치도 알고 있습니다. 그래서 나는 경고음을 사용하여 추론과 과거에 전화를 잘못 놓았던 위치에 대한 사전 정보를 결합하여 전화를 찾기 위해 검색해야 할 영역을 식별합니다.


11
나는 유추를 좋아한다. 잦은 추론을 사용하여 답변을 도출하고 Bayesian을 사용하여 답변을 도출 한 정의 된 질문 (데이터 세트를 기반으로 함)이 있고, 두 가지 추론을 모두 처리하기 위해 R 스크립트를 사용하는 것이 좋습니다. 너무 많이 묻고 있습니까?
Farrel

15
내가 생각할 수있는 가장 간단한 것은 동전을 n 번 던지고 머리의 확률을 추정합니다 (p로 표시). 우리는 k 개의 머리를 관찰한다고 가정 해보십시오. 그런 다음 k 헤드를 얻을 확률은 다음과 같습니다. P (n 시도에서 k 헤드) = (n, k) p ^ k (1-p) ^ (nk) 빈번한 추론은 p = k의 추정치에 도달하기 위해 위의 값을 최대화합니다. / n. Bayesian은 다음과 같이 말할 것입니다. 안녕하세요, p ~ Beta (1,1) (p가 [0,1]에서 균일하다고 가정하는 것과 같습니다)를 알고 있습니다. 따라서 업데이트 된 추론은 다음과 같습니다 .p ~ Beta (1 + k, 1 + nk) 따라서 p의 베이지안 추정값은 p = 1 + k / (2 + n)입니다. R을 알 수 없습니다. 죄송합니다.

41
잦은 주의자 관점에서 사전 지식 모델에 통합 할 수없는 이유는 없다는 점을 지적해야합니다 . 이런 점에서, 잦은 관점은 더 단순합니다. 모델과 데이터 만 있습니다. 이전 정보를 모델에서 분리 할 필요가 없습니다.
Robby McKilliam

1
@ user28 귀하의 의견에 대한 의견으로서, 이면, 잦은 주의자 는 헤드 (각각 헤드) 의 결과를 볼 때 (각각 )을 추정합니다 . 즉, 동전은 두 머리 또는 두 꼬리. 베이지안 추정치 와 각각 약간 덜 편향된 동전 일 가능성을 허용합니다. , P = 0 , P = 1 K = 0 K = 3 1 / 5 4 / 5n=3p=0p=1k=0k=31/54/5
Dilip Sarwate

3
@ BYS2 R이라는 프로그래밍 언어
user1205901

102

뺨에 단단히 혀 :

베이지안은 대부분의 비 통계 학자들이하는 것과 같은 방식으로, 즉 제안이나 상황의 타당성을 나타내는 "확률"을 정의합니다. 당신이 그에게 질문을한다면, 그는 당신에게 특정 상황에 대한 가능한 결과의 가능성을 설명하는 확률을 할당하는 직접적인 답변을 줄 것입니다 (그리고 그의 이전 가정을 진술하십시오).

Frequentist는 확률이 이벤트가 발생하는 장기주기를 나타내는 것으로 믿는 사람입니다. 필요한 경우, 그는 특정 상황을 무작위 표본으로 간주하여 장기적인 빈도에 대해 의미있게 이야기 할 수있는 가상의 모집단을 발명합니다. 당신이 그에게 특정한 상황에 대한 질문을한다면, 그는 직접적인 대답을하지 않고 대신에 (가상 상상의) 인구에 대해 진술 할 것입니다. 많은 비-자주적 통계 학자들은 답에 의해 쉽게 혼동되어 특정 상황에 대한 베이지안 확률로 해석 할 것입니다.

그러나 대부분의 빈번한 방법은 대부분의 상황에서 본질적으로 동일한 결과를 제공한다는 점에서 베이지안 등가 법을 사용하는 것이 중요합니다. 그 차이는 대체로 철학의 문제이며 실제로는 "코스의 말"의 문제입니다.

당신이 짐작할 수 있듯이, 나는 베이지안 엔지니어입니다. ;영형)


36
비전문가로서, 전체 토론의 핵심은 사람들이 실제로 베이지안처럼 추론하는 것입니다. 당신은 자주 주의자처럼 생각하도록 훈련을 받아야하며, 심지어 베이 즈 식인 것처럼 쉽게 추론하고 추리하거나 추론 할 수 있습니다. "값이이 신뢰 구간 내에있을 확률은 95 %입니다." 충분했다.
Wayne

8
라플라스와 가우스는 19 세기에 사용하기 시작했습니다 통계가없는 반면, 키는 ... "고전"라고 로비의 종류는 20 세기의 통계가 무엇인지에 대해 생각하는 것입니다
GWR

3
어쩌면 나는 빈번한 일을 너무 오랫동안 해왔지만 베이지안 관점이 항상 직관적인지 확실하지 않습니다. 예를 들어, 인구의 평균 신장과 같은 실제 관심 매개 변수에 관심이 있다고 가정합니다. "신뢰할 수있는 구간에 관심있는 매개 변수가 95 % 일 가능성이 있습니다"라고 말한 다음 "다른 매개 변수에 대해 이러한 구간을 100 회 만들면 포함 할 것으로 예상되는 비율은 다음과 같습니다. 매개 변수의 실제 값? ", 대답이 95 가 아니라는 사실은 일부 사람들에게 혼동을 주어야합니다.
Cliff AB

4
@ CliffAB하지만 왜 두 번째 질문을 하시겠습니까? 요점은 서로 다른 질문이므로 다른 답변을 갖는 것은 놀라운 일이 아닙니다. Baysian은 두 가지 질문에 모두 대답 할 수 있지만 그 대답은 다를 수 있습니다 (저에게 합리적으로 보입니다). 잦은 주의자는 (확률에 대한 제한적 정의로 인해) 질문 중 하나에 만 대답 할 수 있으므로 두 질문에 대해 동일한 대답을 내재적으로 사용하므로 문제가 발생합니다. 신뢰할 수있는 구간은 신뢰 구간이 아니지만 베이지안 에서는 신뢰할 수있는 구간과 신뢰 구간을 모두 구성 할 수 있습니다 .
Dikran Marsupial

4
나의 의견은 Wayne 's에 대한 답변이었다. 신뢰할 수있는 간격을 해석하는 것이 더 쉽기 때문에 사람들이 베이지안 맥락에서 "자연스럽게"생각한다는 생각. 내 요점은 신뢰할 수있는 간격 (즉, 단어 수프가 적음)의 올바른 해석을 구성하는 것이 더 간단하지만 비 통계학자가 실제로 의미 하는 바에 대해 혼란 스러울 수 있다고 생각 합니다.
Cliff AB

63

매우 조잡하게 나는 다음과 같이 말할 것입니다.

빈번한 의사 : 샘플링은 무한하며 의사 결정 규칙이 날카 로울 수 있습니다. 데이터는 반복 가능한 랜덤 샘플입니다. 빈도가 있습니다. 기본 파라미터는 고정되어 있습니다. 즉,이 반복 가능한 샘플링 프로세스 중에는 일정하게 유지됩니다.

베이지안 : 알 수없는 양은 확률 적으로 처리되며 항상 세계의 상태를 업데이트 할 수 있습니다. 실현 된 샘플로부터 데이터가 관찰된다. 매개 변수는 알려지지 않았으며 확률 적으로 설명되어 있습니다. 고정 된 데이터입니다.

Bayesian과 Frequentist가 동일한 문제를 해결하는 방법에 대한 심층적 인 예를 제공 하는 훌륭한 블로그 게시물 이 있습니다. 스스로 문제에 답한 다음 확인하십시오.

문제 (Panos Ipeirotis의 블로그에서 가져온) :

뒤집을 때 확률 p로 머리가 끝나고 확률 1-p로 꼬리가되는 동전이 있습니다. (p의 값을 알 수 없습니다.)

p를 추정하려고하면 동전을 100 번 뒤집습니다. 머리가 71 배가됩니다.

그런 다음 다음 이벤트를 결정해야합니다. "다음 두 번의 토스에서 우리는 두 개의 머리를 연속으로 얻게됩니다."

이벤트가 발생하거나 발생하지 않을 것이라고 내기 하시겠습니까?


5
이후 , 내가 충분히이 가까이 간주 할 경우에도 방법은 그냥 재미 중 하나를 겸손하게 갈 (그리고 이전의 모양을 통해 모든 문제를 무시) 준비를 내기. 나는 때때로 훨씬 더 나쁜 확률로 보험 및 복권을 구입합니다. 0.712=0.5041
Henry

5
블로그 포스트의 말미에 "이전에는 균일 분포를 사용하는 대신에 훨씬 더 무관심 할 수 있습니다.이 경우 베타 (0,0) 분포를 이전으로 사용할 수 있습니다. 이 경우, 베이지안과 빈번주의의 두 가지 접근 방식은 동일한 결과를 제공합니다. " 정말 어떤 종류의 요약!
tdc

13
그 블로그 게시물 의 문제는 비 베이 시어 (그러나 합리적인) 의사 결정자가 할 일을 적절하게 특성화하지 않는다는 것입니다. 짚맨에 지나지 않습니다.
whuber

1
@tdc : Bayesian (Jeffreys) 이전은 Beta (0.5, 0.5)이며 일부는 이것이 유일하게 정당한 이전이라고 말합니다.
Neil G

1
@mcb-정확합니다.
digitgopher

42

한 남자가 6 면체 주사위를 굴리고 결과가 1, 2, 3, 4, 5 또는 6이라고 가정합시다. 또한 그는 3에 도달하면 무료 교과서를 줄 것이라고 말합니다.

그런 다음 비공식적으로

는 빈도는 각각의 결과가 발생의 동일한 1 (6) 기회가 있다고 말할 것입니다. 그녀는 확률이 장기 빈도 분포에서 도출 된 것으로 간주합니다.

그러나 Bayesian잠깐만 기다리 라고 말할 것입니다. 저는 그 사람이 유명한 사기꾼 David Blaine이라는 것을 알고 있습니다! 나는 그가 뭔가에 대한 느낌이 있습니다. 3 % 에 도달 할 확률은 1 %에 불과하다는 말을 할 것입니다. 그러나 저는 그 신념을 다시 평가하고 그가 주사위를 굴릴수록 더 많이 바꿀 것입니다. 다른 숫자가 똑같이 자주 나타나는 경우 확률을 1 %에서 약간 더 높은 것으로 반복적으로 증가 시키며, 그렇지 않으면 더 줄입니다. 그녀는 가능성을 제안에 대한 신념으로 본다.


24
나는 잦은 주의자가 자신의 가정을 (구체적으로) 지적하고 유용한 예측을하지 않을 것이라고 생각한다. "다이가 공평하다고 가정하면, 각각의 결과는 6 분의 1의 확률로 발생합니다. 또한 다이 롤이 공평하고 데이비드 블레인이 다이를 17 번 굴릴 경우 5 %의 확률 만있을 것입니다. 3에 착륙하지 않기 때문에 그러한 결과는 주사위가 공정하다는 것을 의심하게 할 것입니다. "
Thomas Levine

그렇다면 "가능성"(MLE에서와 같이)이 빈번 주의자의 "확률"일까요?
Akababa

40

약간의 재미 ...

베이지안은 막연하게 말을 기대하고 당나귀를 엿볼 수있는 사람으로, 그는 노새를 보았다고 강력하게 믿고 있습니다.

이 사이트에서 :

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

같은 사이트에서 멋진 에세이 ...

"베이 즈 정리의 직관적 인 설명"

http://yudkowsky.net/rational/bayes


14
어떤 경우에, 빈번한 사람은 당나귀, 노새 및 말 인구의 비율을 알고있는 사람이 아니며, 노새 팩을 관찰하면 통계적으로 유의미한 증가가 있는지 알기 위해 p- 값을 계산하기 시작합니다. 노새의 인구 비율에서.
앤드류

30

Bayesian은 베팅을해야합니다. 여기에는 약이 대부분의 생명을 구하거나 수감자가 감옥에 가야 할 벽이 더 빨리 벽을 기어 올릴 수 있습니다. 그는 손잡이가 달린 큰 상자를 가지고 있습니다. 그는 자신의 개인적인 의견을 포함하여 자신이 알고있는 모든 것을 상자에 넣은 후 손잡이를 돌리면 최선의 결정을 내릴 수 있다는 것을 알고 있습니다.

잦은 주의자는 보고서를 작성하도록 요청받습니다. 그는 큰 검은 책을 가지고 있습니다. 그가보고해야 할 상황이 그의 규칙서에 의해 다루어지면, 규칙을 따르고 최악의 경우 100에서 한 번 (또는 20에서 한 번 또는 한 번 잘못됨)을주의해서 표현한 보고서를 작성할 수 있습니다 그의 보고서에 대한 사양에 명시된 시간).

베이직은 때때로 자신의 의견이 틀렸을 때 최악의 경우에 나쁜 결과를 초래할 수있는 베팅을하는 것을 알고 있습니다. 잦은 운동가는 (같은 이유로) 베이 즈에 대해 매번 베팅 할 때마다 베팅과 다른 베팅에 대해 베팅하면 장기적으로 패배 할 것임을 알고 있습니다.


"장기적으로 그는 잃을 것이다"는 애매하다. 나는 '그'가 베이지안이라고 가정합니까? 그들은 장기적으로는 평등하지 않을 것입니다-베이지안은 실제 (그러나 알려지지 않은) 사실과 일치 할 때까지 자신의 개인적인 의견을 배우고 바꿀 수 있습니다.
lucidbrot

26

평범한 영어로, 베이지안과 빈번한 추론은 두 가지 다른 방법으로 질문에 대답한다고 말합니다.

확률이란 무엇입니까?

대부분의 차이점은 본질적으로 이론에 대한 유효한 적용 영역을 기본적으로 정의하기 때문에 각각 이이 질문에 어떻게 대답하는지에 달려 있습니다. 이제 더 이상 질문을하지 않으면 서 "일반 영어"라는 용어로 대답 할 수 없습니다. 나에게 답은 (아마도 짐작할 수 있듯이)

확률은 논리

이것에 대한 나의 "비 평범한 영어"이유는 우리가 진리를 , 거짓을 나타내면 제안의 미적분학은 확률의 미적분학의 특별한 경우이기 때문입니다.0 110. 또한 확률의 미적분은 제안의 미적분에서 파생 될 수 있습니다. 이는 "베이지안"추론과 가장 밀접하게 일치하지만, 확률을 할당하는 원칙과이를 조작하는 원칙을 제공함으로써 응용 프로그램의 베이지안 추론을 확장합니다. 물론, 이것은 "논리 란 무엇입니까?"라는 후속 질문으로 이어집니다. 나에게이 질문에 대한 답으로 내가 줄 수있는 가장 가까운 것은 "논리가 주어진 가정을 가진 합리적인 사람의 상식 판단"(합리적인 사람은 무엇인가?)이다. 논리에는 베이지안 추론과 동일한 기능이 모두 있습니다. 예를 들어, 논리는 무엇을 가정해야하는지 또는 "절대 사실"을 말하지 않습니다. 한 제안의 진실이 다른 제안의 진실과 어떻게 관련되어 있는지 알려줍니다. 결론을 시작하려면 항상 "axioms"가있는 논리 시스템을 제공해야합니다. 또한 모순적인 공리에서 임의의 결과를 얻을 수 있다는 점에서 동일한 제한이 있습니다. 그러나 "축 (axioms)"은 이전에 설정된 확률 일뿐입니다.1 . 나를 위해 베이지안 추론을 거부하는 것은 논리를 거부하는 것입니다. 당신이 논리를 받아 들인다면, 베이지안 추론은 "논리에서 논리적으로 흐르기"때문에 (베이직 추론 : P), 베이지안 추론도 받아 들여야합니다.

빈번한 추론에 대한 답은 다음과 같습니다.

확률은 빈도입니다

비록 "빈도"가 여기에서 사용되는 방식으로 평범한 영어 용어인지 잘 모르겠습니다. 아마도 "비율"이 더 나은 단어 일 것입니다. 나는 사건의 확률이 실제 측정 가능한 (관찰 가능한) 양으로 생각되는 잦은 대답에 덧붙이고 싶었다. 이것은 사건을 계산하는 사람 / 물체와 독립적으로 존재한다. 그러나 나는 이것을 "일반 영어"방식으로 할 수 없었다.

따라서 "평범한 영어"버전의 차이점은 빈번한 추론은 "절대"확률에서 추론하려는 시도 일 수 있지만 베이지안 추론은 "상대적"확률에서 추론하려는 시도 일 수 있습니다.

또 다른 차이점은 빈번한 기초가 실제 문제를 이론의 추상 수학으로 변환하는 방법에 대해 더 모호하다는 것입니다. 이론에서 "무작위 변수"를 사용하는 것이 좋은 예입니다. 수학의 추상 세계에는 정확한 정의가 있지만, 관측 된 양이 "무작위"인지 아닌지를 결정하기 위해 사용할 수있는 명확한 절차는 없습니다. 변하기 쉬운".

베이지안 추론 방법, "무작위 변수"의 개념은 필요하지 않습니다. 확률 분포는 수량을 알 수 없기 때문에 수량에 할당됩니다. 즉, 보유한 정보에서 논리적으로 추론 할 수 없습니다. 이것은 "알 수 없음"이 모호하지 않기 때문에 관측 가능한 양과 이론 사이의 간단한 연결을 한 번에 제공합니다.

또한 위의 예에서이 두 가지 사고 방식의 차이점 인 "랜덤"과 "알 수 없음"을 볼 수 있습니다. "무작위"는 "무작위"가 실제 수량의 속성 인 것처럼 보이도록 표현됩니다. 반대로 "알 수 없음"은 해당 수량에 대해 어떤 사람에게 문의하는지에 따라 달라집니다. 따라서 분석을 수행하는 통계학 자의 자산입니다. 이것은 종종 각 이론에 첨부 된 "객관적인"대 "주관적인"형용사를 일으킨다. "무작위"는 동일한 수량에 대해 서로 다른 정보를 제공받는 두 명의 빈민에게 "무작위"여부를 결정하도록 요청함으로써 일부 표준 예의 속성이 될 수 없음을 쉽게 알 수 있습니다. 하나는 일반적인 Bernoulli Urn입니다. 잦은 주의자 1은 그림을 그리는 동안 눈가리개를합니다. 잦은 주의자 2가 항아리 위에 서있는 반면, 잦은 주의자 1은 항아리에서 공을 꺼내는 것을 봅니다. "무작위"의 선언이 항아리에있는 공의 속성이라면, 그것은 잦은 1과 2의 다른 지식에 의존 할 수 없으므로 두 명의 잦은자는 동일한 "무작위"또는 "무작위"의 선언을해야합니다 .


3
상식에 대한 언급없이 이것을 다시 작성할 수 있다면 관심이 있습니다.
피터 엘리스

@PeterEllis-상식에 어떤 문제가 있습니까? 우리는 모두 그것을 가지고 있으며, 그것을 사용하지 않는 것은 일반적으로 어리석은 일입니다 ...
chanceislogic

13
그것은 실제로 무엇이고, 문화적으로도 너무 경쟁적입니다. "상식"은이 특정 문화에서 일을 수행하는 지각있는 현명한 방법 (시간과 공간에서 현명하고 다른 문화와는 거리가 멀어 보이는 경우)에 대한 짧은 손입니다. . 그것은 논리의 정의의 일부로서 특히 도움이되지 않습니다 (그리고 저는 특정 맥락에서 "합리적인 사람"이라는 개념입니다-특히 "합리적인 사람"에 대한 당신의 정의가 논리적 인 사람이라고 추측 할 때 상식을 가진 사람!)
Peter Ellis

4
그는 하나를 제공 할 수 없으며, 그의 주장은 보편적 인 정의가없고 문화적 으로 정의 된 것만 있다는 것이다. 다른 문화적 배경을 가진 (그리고 다른 스타일의 통계 교육을 포함하는) 두 사람은 주어진 상황에서 할 수있는 일에 대해 두 가지 다른 이해를 가질 것입니다.
naught101

2
이 답변에는 좋은 점이 있지만 (일반 영어의 경우는 어떻습니까?) 다음 문장이 사실이라고 믿지 않습니다 (베이지 인 인 경우). "논리를 받아들이면 ... 베이지안 추론 ". 예를 들어, 수학의 추상 이론을 실제 세계로 변환하는 대신에 공리적 접근 방식이 빈번주의 및 베이지안 추론과 일치 할 수 있다는 것을 알게 될 것입니다! 틀림없이 첫 번째 경우 Kolmogorov, 두 번째 경우 Jeffreys. 본질적으로, 그것은 논리 인 확률 이론입니다. 해석이 아닙니다.
Graeme Walsh

21

실제로, 나는이 문제를 둘러싼 많은 철학이 웅장하다고 생각합니다. 그것은 논쟁을 일축하는 것이 아니라주의의 말씀입니다. 때로는 실제적인 문제가 우선합니다-아래에 예를 들어 보겠습니다.

또한 두 가지 이상의 접근 방식이 있다고 쉽게 주장 할 수 있습니다.

  • 네이 먼-피어슨
  • 우도 기반 접근법
  • 완전 베이지안

선임 동료는 최근에“공통 언어를 사용하는 많은 사람들이 잦은 주의자와 베이지안에 대해 이야기하고 있습니다. 더 유효한 구별은 가능성에 기반하고 잦은 주의자라고 생각합니다. 최대한의 가능성과 베이지안 방법은 가능성 원칙을 준수 하지만 잦은 방법은 그렇지 않습니다. "

매우 간단한 실제 예부터 시작하겠습니다.

P(+|S)=1
P(Correct|S)=1
P(|H)=0.95
P(+|H)=0.05

따라서 검사는 환자의 건강 여부에 따라 100 % 정확하거나 95 % 정확합니다. 종합하면, 테스트가 95 % 이상 정확하다는 것을 의미합니다.

여태까지는 그런대로 잘됐다. 그것들은 자주 사용하는 사람들이 할 말입니다. 이러한 진술은 이해하기 쉽고 사실입니다. '자주 주의적 해석'에 대해 와플 할 필요가 없습니다.

그러나 상황을 바꾸려고 할 때 상황이 흥미로워집니다. 검사 결과가 주어지면 환자의 건강에 대해 무엇을 배울 수 있습니까? 부정적인 검사 결과가 주어지면 거짓 부정이 없기 때문에 환자는 분명히 건강합니다.

그러나 테스트가 긍정적 인 경우도 고려해야합니다. 환자가 실제로 아프기 때문에 검사가 양성 이었습니까, 아니면 거짓 양성입니까? 이것은 잦은 주의자와 베이지안이 갈라지는 곳입니다. 모든 사람은 지금 당장은 대답 할 수 없다는 데 동의 할 것입니다. 잦은 주의자는 답변을 거부 할 것입니다. 베이지안은 당신에게 답을 줄 준비가되어있을 것입니다. 그러나 베이지안을 먼저 먼저 제공해야합니다.

요약하면 다음과 같습니다.

  • 건강한 환자의 경우 검사가 매우 정확합니다.
  • 아픈 환자의 경우 검사가 매우 정확합니다.

그런 말에 만족한다면 빈번한 해석을 사용하고 있습니다. 보고있는 문제의 종류에 따라 프로젝트마다 다를 수 있습니다.

그러나 다른 진술을하고 다음 질문에 대답하고 싶을 수도 있습니다.

  • 검사 결과가 긍정적 인 환자에게는 검사가 얼마나 정확합니까?

이를 위해서는 사전 및 베이지안 접근이 필요합니다. 또한 이것은 의사에게 관심있는 유일한 질문입니다. 의사는 "환자가 긍정적 인 결과 나 부정적인 결과를 얻을 것이라는 것을 알고 있습니다. 또한 부정적인 결과는 환자가 건강하고 집으로 돌아갈 수 있음을 의미합니다. 지금 관심있는 유일한 환자는 긍정적 인 결과-아파요? "

요약 : 이와 같은 예에서 베이지안은 잦은 주의자가 말한 모든 것에 동의합니다. 그러나 베이지안은 빈번한 진술이 사실이지만 유용하지 않다고 주장 할 것이다. 유용한 질문은 사전에 답변해야한다고 주장합니다.

잦은 주의자는 매개 변수의 가능한 모든 값 (H 또는 S)을 차례로 고려하여 "매개 변수가이 값과 같은 경우 테스트가 정확할 확률은 얼마입니까?"라고 묻습니다.

베이지안은 대신 각각의 가능한 관측 값 (+ 또는-)을 고려하여 "그 값을 방금 관찰했다고 생각되면 H- 대 -S의 조건부 확률에 대해 무엇을 알려줍니까?"라고 물을 것입니다.


1
당신은 For sick patients, the test is NOT very accurate.당신이 NOT을 잊지 의미 합니까?
agstudy

1
두 경우 모두 매우 정확하므로 한 마디도 잊지 않았습니다. 건강한 사람의 경우 결과는 95 %의 시간 (예 : '부정적')으로 정확합니다. 그리고 아픈 사람들의 경우 결과는 95 %의 시간 (올바른 '긍정적')입니다.
Aaron McDaid

최대 가능성의 "약점"은 데이터 이전에 균일 한 것으로 가정하지만 "전체 베이지안"은 이전에 선택할 수있는 것에서 더 유연하다는 것입니다.
Joe Z.

예제를 완성하기 위해 인구의 0.1 %가 우리가 테스트하고있는 질병 D에 걸린다고 가정 해 봅시다. 이것은 우리의 이전이 아닙니다. 의사에게 와서 D와 일치하는 증상이있는 환자의 30 %는 실제로 D를 가지고있을 가능성이 높습니다 (다른 질병이 같은 증상을 나타내는 빈도와 같은 세부 사항에 따라 다소 다를 수 있음). 따라서 시험을 치르는 사람의 70 %가 건강하고 66.5 %가 부정적인 결과를 낳고 30 % / 33.5 %가 아프다. 긍정적 인 결과를 볼 때 환자가 아플 확률은 89.6 %입니다. 다음 퍼즐 : 시험 응시자의 70 %가 D를 가지고 있다는 것을 어떻게 알았습니까?
Qwertie

7

베이지안 및 빈번한 통계는 과거 사건과 가정 된 모델을 기반으로 미래 사건의 확률을 평가하는 두 가지 제한 사례로 이해 될 수 있다는 점에서 호환됩니다. 시스템은 여전히 ​​남아 있으며, 이러한 의미에서 매우 많은 관측치가 모델의 매개 변수를 아는 것과 같습니다.

예를 들어, 10 번의 동전 뒤집기의 결과와 같은 관찰이 있다고 가정합니다. 베이지안 통계에서는 관측 한 것부터 시작하여 향후 관측 또는 모형 모수의 확률을 평가합니다. 빈번한 통계에서는 동전을 편중하지 않고 여러 번 던지면 50 %의 머리를 올리는 것과 같이 많은 관찰이 이루어진 시나리오를 가정하여 사실에 대한 아이디어 (가설)에서 시작합니다. 많은 수의 관찰 (가설) 시나리오를 기반으로, 수행 한 것과 같은 관찰 빈도, 즉 10 코인 플립의 다른 결과 빈도를 평가합니다. 그런 다음에야 실제 결과를 가져 와서 가능한 결과의 빈도와 비교하고 결과가 높은 빈도로 발생할 것으로 예상되는 결과에 속하는지 여부를 결정해야합니다. 이 경우 관찰 한 내용이 시나리오와 모순되지 않는다는 결론을 내립니다 (= 가설). 그렇지 않으면 관측치가 시나리오와 호환되지 않는다는 결론을 내릴 수 있으며 가설을 기각 할 수 있습니다.

따라서 베이지안 통계는 관찰 된 것부터 시작하여 가능한 미래 결과를 평가합니다. 빈번한 통계는 무언가를 가정했을 때 관찰되는 것에 대한 추상 실험으로 시작한 다음 추상 실험의 결과를 실제로 관찰 된 것과 비교합니다. 그렇지 않으면 두 가지 접근 방식이 호환됩니다. 그들은 둘 다 만들어 지거나 가정 된 관측에 근거하여 미래 관측의 확률을 평가한다.

나는 이것을보다 공식적인 방식으로 작성하기 시작했습니다.

베이지안 추론을 빈번한 추론의 특정 응용으로, 그 반대의 경우도 마찬가지입니다. 무화과.

http://dx.doi.org/10.6084/m9.figshare.867707

원고는 새로운 것입니다. 당신이 그것을 읽고 의견이 있으면 알려 주시기 바랍니다.


6

나는 그들이 다른 방식으로 확률을 본다고 말합니다. 베이지안은 주관적이며 선험적 신념을 사용하여 알려지지 않은 매개 변수의 가능한 값에 대한 사전 확률 분포를 정의합니다. 그래서 그는 deFinetti와 같은 확률 이론에 의존합니다. 잦은 주의자는 확률을 관측 된 비율에 따라 제한 주파수와 관련이있는 것으로 간주합니다. 이것은 Kolmogorov와 von Mises에 의해 개발 된 확률 이론과 일치합니다.
잦은 주의자는 우도 함수 만 사용하여 모수 추론을 수행합니다. 베이지안은 그것을 취하여 사전에 곱한 후 정규화하여 추론에 사용하는 사후 분포를 얻습니다.


4
+1 좋은 대답이지만, 베이지안 접근법과 빈도 접근법 은 확률 해석 과 관련하여 다르다는 점을 강조해야합니다 . 반면에 Kolmogorov 는 확률 이론에 대한 공리 기반 을 제공하며 , 베이지안 또는 Frequentist가 사용하는 것과 같은 해석 (!)이 필요하지 않습니다 . 어떤 의미에서, 공리 시스템은 그 자체의 삶을 가지고 있습니다! 콜 모고 로프의 6 가지 공리만으로도 그의 공리 시스템이 베이지안이거나 빈번한 것이라고 말할 수는 없으며 실제로 두 가지 모두와 일치 할 수 있다고 생각합니다.
Graeme Walsh

0

이 질문에 대답하는 방법은 자주 사용하는 사람들이 자신이 보는 데이터를 예상 한 것과 비교하는 것입니다. 즉, 그들은 얼마나 자주 발생해야하는지 에 대한 정신적 모델을 가지고 있으며 데이터와 발생 빈도를 확인합니다. 즉, 그들이 선택한 모델에 따라 그들이 본 데이터의 가능성은 어느 정도입니까?

반면 베이지안 사람들 그들의 정신 모델을 결합 합니다. 즉, 그들은 이전의 경험을 바탕으로 데이터가 어떻게 보일지 생각하는 모델을 가지고 있으며, `` 후부 ''신념 에 정착하기 위해 관찰 한 데이터와 이것을 결합합니다 . 즉, 그들은 그들이 선택한 데이터가 그들이 관측 한 데이터를 고려할 때 유효한 확률을 찾습니다.


-2

빈번한 : 자연의 진정한 상태는입니다. 습관적으로 이와 같은 분석을 수행하면 내 답변의 95 %가 정확합니다.

베이지안 : 진정한 답이 95 % 일 가능성이 있습니다. 나는 당신이 나에게 준 데이터와 진실이 무엇인지에 대한 우리의 이전 추측에 근거합니다.


-3

빈번한 : 주사위에 베팅. 주사위의 가치 만이 결과를 결정할 것입니다 : 당신은 내기를이기거나하지 않습니다. 우연에 따라 다릅니다.

베이지안 : 텍사스 홀덤 포커 게임. 당신은 두 카드를 보는 유일한 사람입니다. 테이블에있는 다른 플레이어들에 대한 지식이 있습니다. 플롭, 턴, 리버에서 이길 수있는 가능성을 조정해야하며, 남은 선수에 따라 가능할 수도 있습니다. 그들은 종종 허세합니까? 그들은 공격적이거나 수동적 인 선수입니까? 이 모든 것이 당신이하는 일을 결정할 것입니다. 당신이 얻은 첫 두 핸드 카드의 가능성뿐만 아니라, 당신이 이길 것인지 아닌지를 결정할 것입니다.

잦은 포커를하는 것은 모든 플레이어가 처음에 손을 보여주고 플롭, 턴 및 리버 카드가 표시되기 전에 베팅하거나 접는 것을 의미합니다. 이제는 승리 여부에 따라 다시 우연히 결정됩니다.


-5

두통이 생겼다면 의사를 만나러 가십시오. 의사의 의사 결정에는 두통의 두 가지 원인, 뇌종양의 # 1 (시간의 99 %의 두통을 유발하는 근본 원인) 및 # 2의 감기 (매우 적은 환자에서 두통을 유발할 수있는 원인)가 있다고 가정합니다. .

그런 다음 Frequentist 접근 방식을 기반으로 한 의사 결정은 뇌종양입니다.

베이지안 접근을 기반으로 한 의사의 결정에 따르면 감기에 걸렸습니다 (감기의 1 % 만 두통을 유발하더라도)


1
(-1) "자주 의사"와 "베이지 아 의사"의 차이점이 무엇인지 확실하지 않습니다. Frequentist 의사가 감기 유발 두통에 대한 데이터를 무시할 이유가 없습니다 . Bayesian doc은 Bayes 정리 또는 이전의 것을 사용하지 않는 것 같습니다.
Tim

유용하거나 재미있는 비유가 될 수 없습니다.
닉 콕스

-6

수컷 고양이와 암컷 고양이는 70 일 동안 충분한 음식과 물과 함께 강철 방에 담겨 있습니다.

빈번한 전문가는 고양이 의 평균 임신 기간 이 66 일이고, 고양이갇 히면 암컷이 더운 상태이고, 한 번 더 뜨거워지면 4 ~ 7 일 동안 반복적으로 짝짓기를 할 것이라고 말합니다 . 많은 번식과 충분한 임신 시간이 있었기 때문에 70 일에 상자가 열리면 새끼 고양이가 흩날 릴 가능성이 있습니다.

Bayesian은 1 일에 박스에서 나오는 심각한 Marvin Gaye의 소리를 들었다가 오늘 아침 상자에서 나오는 새끼 고양이 같은 소리가 많이 들렸다 고 말합니다. 따라서 고양이 생식에 대해 많이 알지 못하면 70 일에 상자를 열면 새끼 고양이가 흩날 릴 가능성이 있습니다.


내가 쓴 방식, 특히 베이지 안에서 고양이 생식에 대해 많이 알지 못했지만 처음에는 빈번한 사람만이 새끼 고양이에 내기를 걸었습니다. 매우 조잡한 예의 관련 요점 은 주로 잦은 주의자가 처음에 데이터를 기반으로 예측을 한 다음 새로운 보충 데이터를 통합하지 않고 앉았지만 베이지안은 시작할 데이터가 많지 않았지만 계속 통합했다는 것입니다 사용 가능한 관련 데이터.
사자 라이온

3
... 베이지 인이 아닌 사람들이 왜 추가 데이터를 이용할 수 없는가?
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.