베이지안을 빈번한 추론과 구별하는 특징을 일반 영어로 어떻게 설명 하시겠습니까?
베이지안을 빈번한 추론과 구별하는 특징을 일반 영어로 어떻게 설명 하시겠습니까?
답변:
할머니와의 기본적인 차이점을 설명하는 방법은 다음과 같습니다.
집 어딘가에 내 휴대 전화를 잘못 놓았습니다. 악기 바닥에있는 전화 로케이터를 사용하여 전화를 찾을 수 있으며 전화 로케이터를 누르면 전화 음이 울립니다.
문제점 : 집에서 어느 지역을 검색해야합니까?
전화 음이 들립니다. 또한 사운드가 나오는 영역을 식별하는 데 도움이되는 정신 모델도 있습니다. 따라서 경고음이 들리면 전화를 찾기 위해 검색해야하는 집 지역을 추측합니다.
전화 음이 들립니다. 이제는 소리가 나오는 영역을 식별하는 데 도움이되는 정신 모델 외에 과거에 전화를 잘못 놓은 위치도 알고 있습니다. 그래서 나는 경고음을 사용하여 추론과 과거에 전화를 잘못 놓았던 위치에 대한 사전 정보를 결합하여 전화를 찾기 위해 검색해야 할 영역을 식별합니다.
뺨에 단단히 혀 :
베이지안은 대부분의 비 통계 학자들이하는 것과 같은 방식으로, 즉 제안이나 상황의 타당성을 나타내는 "확률"을 정의합니다. 당신이 그에게 질문을한다면, 그는 당신에게 특정 상황에 대한 가능한 결과의 가능성을 설명하는 확률을 할당하는 직접적인 답변을 줄 것입니다 (그리고 그의 이전 가정을 진술하십시오).
Frequentist는 확률이 이벤트가 발생하는 장기주기를 나타내는 것으로 믿는 사람입니다. 필요한 경우, 그는 특정 상황을 무작위 표본으로 간주하여 장기적인 빈도에 대해 의미있게 이야기 할 수있는 가상의 모집단을 발명합니다. 당신이 그에게 특정한 상황에 대한 질문을한다면, 그는 직접적인 대답을하지 않고 대신에 (가상 상상의) 인구에 대해 진술 할 것입니다. 많은 비-자주적 통계 학자들은 답에 의해 쉽게 혼동되어 특정 상황에 대한 베이지안 확률로 해석 할 것입니다.
그러나 대부분의 빈번한 방법은 대부분의 상황에서 본질적으로 동일한 결과를 제공한다는 점에서 베이지안 등가 법을 사용하는 것이 중요합니다. 그 차이는 대체로 철학의 문제이며 실제로는 "코스의 말"의 문제입니다.
당신이 짐작할 수 있듯이, 나는 베이지안 엔지니어입니다. ;영형)
매우 조잡하게 나는 다음과 같이 말할 것입니다.
빈번한 의사 : 샘플링은 무한하며 의사 결정 규칙이 날카 로울 수 있습니다. 데이터는 반복 가능한 랜덤 샘플입니다. 빈도가 있습니다. 기본 파라미터는 고정되어 있습니다. 즉,이 반복 가능한 샘플링 프로세스 중에는 일정하게 유지됩니다.
베이지안 : 알 수없는 양은 확률 적으로 처리되며 항상 세계의 상태를 업데이트 할 수 있습니다. 실현 된 샘플로부터 데이터가 관찰된다. 매개 변수는 알려지지 않았으며 확률 적으로 설명되어 있습니다. 고정 된 데이터입니다.
Bayesian과 Frequentist가 동일한 문제를 해결하는 방법에 대한 심층적 인 예를 제공 하는 훌륭한 블로그 게시물 이 있습니다. 스스로 문제에 답한 다음 확인하십시오.
문제 (Panos Ipeirotis의 블로그에서 가져온) :
뒤집을 때 확률 p로 머리가 끝나고 확률 1-p로 꼬리가되는 동전이 있습니다. (p의 값을 알 수 없습니다.)
p를 추정하려고하면 동전을 100 번 뒤집습니다. 머리가 71 배가됩니다.
그런 다음 다음 이벤트를 결정해야합니다. "다음 두 번의 토스에서 우리는 두 개의 머리를 연속으로 얻게됩니다."
이벤트가 발생하거나 발생하지 않을 것이라고 내기 하시겠습니까?
한 남자가 6 면체 주사위를 굴리고 결과가 1, 2, 3, 4, 5 또는 6이라고 가정합시다. 또한 그는 3에 도달하면 무료 교과서를 줄 것이라고 말합니다.
그런 다음 비공식적으로
는 빈도는 각각의 결과가 발생의 동일한 1 (6) 기회가 있다고 말할 것입니다. 그녀는 확률이 장기 빈도 분포에서 도출 된 것으로 간주합니다.
그러나 Bayesian 은 잠깐만 기다리 라고 말할 것입니다. 저는 그 사람이 유명한 사기꾼 David Blaine이라는 것을 알고 있습니다! 나는 그가 뭔가에 대한 느낌이 있습니다. 3 % 에 도달 할 확률은 1 %에 불과하다는 말을 할 것입니다. 그러나 저는 그 신념을 다시 평가하고 그가 주사위를 굴릴수록 더 많이 바꿀 것입니다. 다른 숫자가 똑같이 자주 나타나는 경우 확률을 1 %에서 약간 더 높은 것으로 반복적으로 증가 시키며, 그렇지 않으면 더 줄입니다. 그녀는 가능성을 제안에 대한 신념으로 본다.
약간의 재미 ...
이 사이트에서 :
http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html
같은 사이트에서 멋진 에세이 ...
"베이 즈 정리의 직관적 인 설명"
Bayesian은 베팅을해야합니다. 여기에는 약이 대부분의 생명을 구하거나 수감자가 감옥에 가야 할 벽이 더 빨리 벽을 기어 올릴 수 있습니다. 그는 손잡이가 달린 큰 상자를 가지고 있습니다. 그는 자신의 개인적인 의견을 포함하여 자신이 알고있는 모든 것을 상자에 넣은 후 손잡이를 돌리면 최선의 결정을 내릴 수 있다는 것을 알고 있습니다.
잦은 주의자는 보고서를 작성하도록 요청받습니다. 그는 큰 검은 책을 가지고 있습니다. 그가보고해야 할 상황이 그의 규칙서에 의해 다루어지면, 규칙을 따르고 최악의 경우 100에서 한 번 (또는 20에서 한 번 또는 한 번 잘못됨)을주의해서 표현한 보고서를 작성할 수 있습니다 그의 보고서에 대한 사양에 명시된 시간).
베이직은 때때로 자신의 의견이 틀렸을 때 최악의 경우에 나쁜 결과를 초래할 수있는 베팅을하는 것을 알고 있습니다. 잦은 운동가는 (같은 이유로) 베이 즈에 대해 매번 베팅 할 때마다 베팅과 다른 베팅에 대해 베팅하면 장기적으로 패배 할 것임을 알고 있습니다.
평범한 영어로, 베이지안과 빈번한 추론은 두 가지 다른 방법으로 질문에 대답한다고 말합니다.
확률이란 무엇입니까?
대부분의 차이점은 본질적으로 이론에 대한 유효한 적용 영역을 기본적으로 정의하기 때문에 각각 이이 질문에 어떻게 대답하는지에 달려 있습니다. 이제 더 이상 질문을하지 않으면 서 "일반 영어"라는 용어로 대답 할 수 없습니다. 나에게 답은 (아마도 짐작할 수 있듯이)
확률은 논리
이것에 대한 나의 "비 평범한 영어"이유는 우리가 진리를 , 거짓을 나타내면 제안의 미적분학은 확률의 미적분학의 특별한 경우이기 때문입니다.0 1. 또한 확률의 미적분은 제안의 미적분에서 파생 될 수 있습니다. 이는 "베이지안"추론과 가장 밀접하게 일치하지만, 확률을 할당하는 원칙과이를 조작하는 원칙을 제공함으로써 응용 프로그램의 베이지안 추론을 확장합니다. 물론, 이것은 "논리 란 무엇입니까?"라는 후속 질문으로 이어집니다. 나에게이 질문에 대한 답으로 내가 줄 수있는 가장 가까운 것은 "논리가 주어진 가정을 가진 합리적인 사람의 상식 판단"(합리적인 사람은 무엇인가?)이다. 논리에는 베이지안 추론과 동일한 기능이 모두 있습니다. 예를 들어, 논리는 무엇을 가정해야하는지 또는 "절대 사실"을 말하지 않습니다. 한 제안의 진실이 다른 제안의 진실과 어떻게 관련되어 있는지 알려줍니다. 결론을 시작하려면 항상 "axioms"가있는 논리 시스템을 제공해야합니다. 또한 모순적인 공리에서 임의의 결과를 얻을 수 있다는 점에서 동일한 제한이 있습니다. 그러나 "축 (axioms)"은 이전에 설정된 확률 일뿐입니다. . 나를 위해 베이지안 추론을 거부하는 것은 논리를 거부하는 것입니다. 당신이 논리를 받아 들인다면, 베이지안 추론은 "논리에서 논리적으로 흐르기"때문에 (베이직 추론 : P), 베이지안 추론도 받아 들여야합니다.
빈번한 추론에 대한 답은 다음과 같습니다.
확률은 빈도입니다
비록 "빈도"가 여기에서 사용되는 방식으로 평범한 영어 용어인지 잘 모르겠습니다. 아마도 "비율"이 더 나은 단어 일 것입니다. 나는 사건의 확률이 실제 측정 가능한 (관찰 가능한) 양으로 생각되는 잦은 대답에 덧붙이고 싶었다. 이것은 사건을 계산하는 사람 / 물체와 독립적으로 존재한다. 그러나 나는 이것을 "일반 영어"방식으로 할 수 없었다.
따라서 "평범한 영어"버전의 차이점은 빈번한 추론은 "절대"확률에서 추론하려는 시도 일 수 있지만 베이지안 추론은 "상대적"확률에서 추론하려는 시도 일 수 있습니다.
또 다른 차이점은 빈번한 기초가 실제 문제를 이론의 추상 수학으로 변환하는 방법에 대해 더 모호하다는 것입니다. 이론에서 "무작위 변수"를 사용하는 것이 좋은 예입니다. 수학의 추상 세계에는 정확한 정의가 있지만, 관측 된 양이 "무작위"인지 아닌지를 결정하기 위해 사용할 수있는 명확한 절차는 없습니다. 변하기 쉬운".
베이지안 추론 방법, "무작위 변수"의 개념은 필요하지 않습니다. 확률 분포는 수량을 알 수 없기 때문에 수량에 할당됩니다. 즉, 보유한 정보에서 논리적으로 추론 할 수 없습니다. 이것은 "알 수 없음"이 모호하지 않기 때문에 관측 가능한 양과 이론 사이의 간단한 연결을 한 번에 제공합니다.
또한 위의 예에서이 두 가지 사고 방식의 차이점 인 "랜덤"과 "알 수 없음"을 볼 수 있습니다. "무작위"는 "무작위"가 실제 수량의 속성 인 것처럼 보이도록 표현됩니다. 반대로 "알 수 없음"은 해당 수량에 대해 어떤 사람에게 문의하는지에 따라 달라집니다. 따라서 분석을 수행하는 통계학 자의 자산입니다. 이것은 종종 각 이론에 첨부 된 "객관적인"대 "주관적인"형용사를 일으킨다. "무작위"는 동일한 수량에 대해 서로 다른 정보를 제공받는 두 명의 빈민에게 "무작위"여부를 결정하도록 요청함으로써 일부 표준 예의 속성이 될 수 없음을 쉽게 알 수 있습니다. 하나는 일반적인 Bernoulli Urn입니다. 잦은 주의자 1은 그림을 그리는 동안 눈가리개를합니다. 잦은 주의자 2가 항아리 위에 서있는 반면, 잦은 주의자 1은 항아리에서 공을 꺼내는 것을 봅니다. "무작위"의 선언이 항아리에있는 공의 속성이라면, 그것은 잦은 1과 2의 다른 지식에 의존 할 수 없으므로 두 명의 잦은자는 동일한 "무작위"또는 "무작위"의 선언을해야합니다 .
실제로, 나는이 문제를 둘러싼 많은 철학이 웅장하다고 생각합니다. 그것은 논쟁을 일축하는 것이 아니라주의의 말씀입니다. 때로는 실제적인 문제가 우선합니다-아래에 예를 들어 보겠습니다.
또한 두 가지 이상의 접근 방식이 있다고 쉽게 주장 할 수 있습니다.
선임 동료는 최근에“공통 언어를 사용하는 많은 사람들이 잦은 주의자와 베이지안에 대해 이야기하고 있습니다. 더 유효한 구별은 가능성에 기반하고 잦은 주의자라고 생각합니다. 최대한의 가능성과 베이지안 방법은 가능성 원칙을 준수 하지만 잦은 방법은 그렇지 않습니다. "
매우 간단한 실제 예부터 시작하겠습니다.
따라서 검사는 환자의 건강 여부에 따라 100 % 정확하거나 95 % 정확합니다. 종합하면, 테스트가 95 % 이상 정확하다는 것을 의미합니다.
여태까지는 그런대로 잘됐다. 그것들은 자주 사용하는 사람들이 할 말입니다. 이러한 진술은 이해하기 쉽고 사실입니다. '자주 주의적 해석'에 대해 와플 할 필요가 없습니다.
그러나 상황을 바꾸려고 할 때 상황이 흥미로워집니다. 검사 결과가 주어지면 환자의 건강에 대해 무엇을 배울 수 있습니까? 부정적인 검사 결과가 주어지면 거짓 부정이 없기 때문에 환자는 분명히 건강합니다.
그러나 테스트가 긍정적 인 경우도 고려해야합니다. 환자가 실제로 아프기 때문에 검사가 양성 이었습니까, 아니면 거짓 양성입니까? 이것은 잦은 주의자와 베이지안이 갈라지는 곳입니다. 모든 사람은 지금 당장은 대답 할 수 없다는 데 동의 할 것입니다. 잦은 주의자는 답변을 거부 할 것입니다. 베이지안은 당신에게 답을 줄 준비가되어있을 것입니다. 그러나 베이지안을 먼저 먼저 제공해야합니다.
요약하면 다음과 같습니다.
그런 말에 만족한다면 빈번한 해석을 사용하고 있습니다. 보고있는 문제의 종류에 따라 프로젝트마다 다를 수 있습니다.
그러나 다른 진술을하고 다음 질문에 대답하고 싶을 수도 있습니다.
이를 위해서는 사전 및 베이지안 접근이 필요합니다. 또한 이것은 의사에게 관심있는 유일한 질문입니다. 의사는 "환자가 긍정적 인 결과 나 부정적인 결과를 얻을 것이라는 것을 알고 있습니다. 또한 부정적인 결과는 환자가 건강하고 집으로 돌아갈 수 있음을 의미합니다. 지금 관심있는 유일한 환자는 긍정적 인 결과-아파요? "
요약 : 이와 같은 예에서 베이지안은 잦은 주의자가 말한 모든 것에 동의합니다. 그러나 베이지안은 빈번한 진술이 사실이지만 유용하지 않다고 주장 할 것이다. 유용한 질문은 사전에 답변해야한다고 주장합니다.
잦은 주의자는 매개 변수의 가능한 모든 값 (H 또는 S)을 차례로 고려하여 "매개 변수가이 값과 같은 경우 테스트가 정확할 확률은 얼마입니까?"라고 묻습니다.
베이지안은 대신 각각의 가능한 관측 값 (+ 또는-)을 고려하여 "그 값을 방금 관찰했다고 생각되면 H- 대 -S의 조건부 확률에 대해 무엇을 알려줍니까?"라고 물을 것입니다.
For sick patients, the test is NOT very accurate.
당신이 NOT을 잊지 의미 합니까?
베이지안 및 빈번한 통계는 과거 사건과 가정 된 모델을 기반으로 미래 사건의 확률을 평가하는 두 가지 제한 사례로 이해 될 수 있다는 점에서 호환됩니다. 시스템은 여전히 남아 있으며, 이러한 의미에서 매우 많은 관측치가 모델의 매개 변수를 아는 것과 같습니다.
예를 들어, 10 번의 동전 뒤집기의 결과와 같은 관찰이 있다고 가정합니다. 베이지안 통계에서는 관측 한 것부터 시작하여 향후 관측 또는 모형 모수의 확률을 평가합니다. 빈번한 통계에서는 동전을 편중하지 않고 여러 번 던지면 50 %의 머리를 올리는 것과 같이 많은 관찰이 이루어진 시나리오를 가정하여 사실에 대한 아이디어 (가설)에서 시작합니다. 많은 수의 관찰 (가설) 시나리오를 기반으로, 수행 한 것과 같은 관찰 빈도, 즉 10 코인 플립의 다른 결과 빈도를 평가합니다. 그런 다음에야 실제 결과를 가져 와서 가능한 결과의 빈도와 비교하고 결과가 높은 빈도로 발생할 것으로 예상되는 결과에 속하는지 여부를 결정해야합니다. 이 경우 관찰 한 내용이 시나리오와 모순되지 않는다는 결론을 내립니다 (= 가설). 그렇지 않으면 관측치가 시나리오와 호환되지 않는다는 결론을 내릴 수 있으며 가설을 기각 할 수 있습니다.
따라서 베이지안 통계는 관찰 된 것부터 시작하여 가능한 미래 결과를 평가합니다. 빈번한 통계는 무언가를 가정했을 때 관찰되는 것에 대한 추상 실험으로 시작한 다음 추상 실험의 결과를 실제로 관찰 된 것과 비교합니다. 그렇지 않으면 두 가지 접근 방식이 호환됩니다. 그들은 둘 다 만들어 지거나 가정 된 관측에 근거하여 미래 관측의 확률을 평가한다.
나는 이것을보다 공식적인 방식으로 작성하기 시작했습니다.
베이지안 추론을 빈번한 추론의 특정 응용으로, 그 반대의 경우도 마찬가지입니다. 무화과.
http://dx.doi.org/10.6084/m9.figshare.867707
원고는 새로운 것입니다. 당신이 그것을 읽고 의견이 있으면 알려 주시기 바랍니다.
나는 그들이 다른 방식으로 확률을 본다고 말합니다. 베이지안은 주관적이며 선험적 신념을 사용하여 알려지지 않은 매개 변수의 가능한 값에 대한 사전 확률 분포를 정의합니다. 그래서 그는 deFinetti와 같은 확률 이론에 의존합니다. 잦은 주의자는 확률을 관측 된 비율에 따라 제한 주파수와 관련이있는 것으로 간주합니다. 이것은 Kolmogorov와 von Mises에 의해 개발 된 확률 이론과 일치합니다.
잦은 주의자는 우도 함수 만 사용하여 모수 추론을 수행합니다. 베이지안은 그것을 취하여 사전에 곱한 후 정규화하여 추론에 사용하는 사후 분포를 얻습니다.
이 질문에 대답하는 방법은 자주 사용하는 사람들이 자신이 보는 데이터를 예상 한 것과 비교하는 것입니다. 즉, 그들은 얼마나 자주 발생해야하는지 에 대한 정신적 모델을 가지고 있으며 데이터와 발생 빈도를 확인합니다. 즉, 그들이 선택한 모델에 따라 그들이 본 데이터의 가능성은 어느 정도입니까?
반면 베이지안 사람들 은 그들의 정신 모델을 결합 합니다. 즉, 그들은 이전의 경험을 바탕으로 데이터가 어떻게 보일지 생각하는 모델을 가지고 있으며, `` 후부 ''신념 에 정착하기 위해 관찰 한 데이터와 이것을 결합합니다 . 즉, 그들은 그들이 선택한 데이터가 그들이 관측 한 데이터를 고려할 때 유효한 확률을 찾습니다.
빈번한 : 주사위에 베팅. 주사위의 가치 만이 결과를 결정할 것입니다 : 당신은 내기를이기거나하지 않습니다. 우연에 따라 다릅니다.
베이지안 : 텍사스 홀덤 포커 게임. 당신은 두 카드를 보는 유일한 사람입니다. 테이블에있는 다른 플레이어들에 대한 지식이 있습니다. 플롭, 턴, 리버에서 이길 수있는 가능성을 조정해야하며, 남은 선수에 따라 가능할 수도 있습니다. 그들은 종종 허세합니까? 그들은 공격적이거나 수동적 인 선수입니까? 이 모든 것이 당신이하는 일을 결정할 것입니다. 당신이 얻은 첫 두 핸드 카드의 가능성뿐만 아니라, 당신이 이길 것인지 아닌지를 결정할 것입니다.
잦은 포커를하는 것은 모든 플레이어가 처음에 손을 보여주고 플롭, 턴 및 리버 카드가 표시되기 전에 베팅하거나 접는 것을 의미합니다. 이제는 승리 여부에 따라 다시 우연히 결정됩니다.
두통이 생겼다면 의사를 만나러 가십시오. 의사의 의사 결정에는 두통의 두 가지 원인, 뇌종양의 # 1 (시간의 99 %의 두통을 유발하는 근본 원인) 및 # 2의 감기 (매우 적은 환자에서 두통을 유발할 수있는 원인)가 있다고 가정합니다. .
그런 다음 Frequentist 접근 방식을 기반으로 한 의사 결정은 뇌종양입니다.
베이지안 접근을 기반으로 한 의사의 결정에 따르면 감기에 걸렸습니다 (감기의 1 % 만 두통을 유발하더라도)
수컷 고양이와 암컷 고양이는 70 일 동안 충분한 음식과 물과 함께 강철 방에 담겨 있습니다.
빈번한 전문가는 고양이 의 평균 임신 기간 이 66 일이고, 고양이 가 갇 히면 암컷이 더운 상태이고, 한 번 더 뜨거워지면 4 ~ 7 일 동안 반복적으로 짝짓기를 할 것이라고 말합니다 . 많은 번식과 충분한 임신 시간이 있었기 때문에 70 일에 상자가 열리면 새끼 고양이가 흩날 릴 가능성이 있습니다.
Bayesian은 1 일에 박스에서 나오는 심각한 Marvin Gaye의 소리를 들었다가 오늘 아침 상자에서 나오는 새끼 고양이 같은 소리가 많이 들렸다 고 말합니다. 따라서 고양이 생식에 대해 많이 알지 못하면 70 일에 상자를 열면 새끼 고양이가 흩날 릴 가능성이 있습니다.