베이지안이나 잦은 통계를 먼저 가르쳐야합니까?


32

나는 현재 고등학교에 다니는 소년들을 도와 통계를 이해하고 있으며 이론에 대한 약간의 무시를 무시하지 않고 간단한 예를 시작하는 것을 고려하고 있습니다.

저의 목표는 통계와 양적 학습에 대한 관심을 높이기 위해 처음부터 통계를 배울 수있는 가장 직관적이지만 도구 적으로 구성적인 접근 방식을 제공하는 것입니다.

그러나 시작하기 전에 매우 일반적인 의미를 가진 특별한 질문이 있습니다.

베이지안이나 빈번한 틀을 사용하여 통계를 가르치기 시작해야합니까?

주변 연구에 따르면 일반적인 접근 방식이 빈번한 통계에 대한 간단한 소개와 베이지안 통계 (예 : Stangl )에 대한 심층적 인 논의로 시작됩니다 .


5
더 많은 상황이 없으면 질문에 대답하기가 어렵습니다. 달성하고자하는 것이 무엇입니까?
Glen_b-복지 주 모니카

4
아이들에게 보드카를 따르거나 시가를 켜는 것과 비슷한 베이지안 통계를 가르치는 것은 나쁜 육아입니다. 보드카와 시가는 모두 스스로 발견하기
만하면 괜찮습니다

2
@ Aksakal 나는 실제로 보드카를 마시고 하바나를 퍼프하면서 베이 즈 정리를 가르치려고 계획하고 있었다 ... ;-)
Joe_74

2
그것은 몇 년 동안 아이를 베이지안 통계로부터 멀리하는 좋은 방법입니다. 당신은 베이 즈 정리 응용 프로그램이라고 그들에게 말합니다. 정리는 빈번한 통계에서 잘 작동합니다
Aksakal

5
Nate Silver의 저서 "신호와 소음"은 젊은이들에게 베이지안 통계를 가르치는 사례를 만듭니다.
Lloyd Christmas

답변:


25

베이지안 통계와 잦은 통계는 모두 확률 이론에 기초하지만, 전자는 처음부터 이론에 더 크게 의존한다고 말하고 싶습니다. 반면에, 확실히 신뢰할 수있는 간격의 개념은, 신뢰 구간보다 더 직관적 일단 학생이 확률의 개념을 잘 이해 있습니다. 그래서 당신이 무엇을 선택하든 우선 주사위, 카드, 룰렛, 몬티 홀 역설 등을 기반으로 한 모든 예와 함께 확률 개념에 대한 이해를 강화합니다.

순전히 실용주의적인 접근 방식에 따라 하나의 접근 방식을 선택하거나 다른 접근 방식을 선택합니다. 학교에서 빈번한 통계 나 베이지안 통계를 공부할 가능성이 더 높습니까? 우리나라에서는 빈번한 틀을 먼저 배웁니다 (마지막으로 : 고등학생들이 베이지안 통계를 듣지 못한다는 말을 듣지 못했습니다. 유일한 기회는 대학이나 그 이후에 자율 학습에 의한 것입니다). 어쩌면 당신과 다를 수도 있습니다. NHST (Null Hypothesis Significance Testing)를 처리해야하는 경우 빈번한 통계 IMO와 관련하여 자연스럽게 발생합니다. 물론 베이지안 프레임 워크에서도 가설을 테스트 할 수 있지만, 잦은 주의자 나 베이지안 프레임 워크 (예 : 컬럼비아 대학교의 Andrew Gelman)에서 NHST를 전혀 사용하지 말 것을 주장하는 많은 베이지안 통계학자가 많이 있습니다.

마지막으로, 나는 당신의 나라에서 고등학생의 수준에 대해 모르겠지만, 내에서 학생이 확률 이론과 통합 미적분학을 동시에 성공적으로 동화하는 것은 정말로 어려울 것입니다. 따라서 베이지안 통계를 사용하기로 결정한 경우 연속 랜덤 변수 경우를 피하고 이산 랜덤 변수를 고수합니다.


2
나는 Andrew Gelman이 Bayesian과 마찬가지로 잦은 NSHT에 대해 옹호 할 것이라는 인상을 받았다 (그의 블로그를 읽음).
psarka

2
@psarka 예, 물론 -나는 결코 반대하지 않았습니다.
DeltaIV

3
"우리 나라에서는 잦은 틀을 먼저 배우게 될 것입니다."— 이것이 전 세계적으로 전통적인 접근 방식입니다.
Kodiologist

1
@Kodiologist 나는 의심했다. 적어도 빈번한 틀 이후에 베이 즈 제도도 고등학교에 소개되는 교육 시스템이있을 수 있습니다. 그러나 여기에는 그렇지 않습니다.
DeltaIV

22

베이지안과 빈번한 질문은 다른 질문을합니다. 베이지안에서는 관측 된 데이터를 고려하여 신뢰할 수있는 매개 변수 값을 묻습니다. Frequentist는 가상의 모수 값이 일부인 경우 가상 시뮬레이션 데이터의 가능성에 대해 묻습니다. 빈번한 의사 결정은 오류를 제어함으로써 동기를 부여하고 베이지안 결정은 모델 설명의 불확실성에 의해 동기를 부여합니다.

먼저 무엇을 가르쳐야합니까? 글쎄, 그 질문들 중 하나 또는 다른 질문이 먼저 물어보고 싶은 것이면 그게 답입니다. 그러나 접근성과 교육학 측면에서 Bayesian은 이해하기가 훨씬 쉽고 훨씬 직관적이라고 생각합니다. 베이지안 분석의 기본 아이디어는 Sherlock Holmes가 유명하게 말한 것처럼 수백만의 독자가 직관적으로 이해 한 것처럼 가능성에 대한 신뢰도의 재 할당입니다. 그러나 빈번한 분석의 기본 아이디어는 매우 까다 롭습니다. 특정 가설이 참인 경우 발생할 수있는 모든 가능한 데이터 세트의 공간과 요약 통계 또는 요약보다 더 극단적 인 가상 데이터 세트의 비율 실제로 관찰 된 통계입니다.

베이지안 아이디어에 대한 무료 소개 장이 여기에 있습니다 . 잦은주의와 베이지안 개념을 나란히 설정하는 기사가 있습니다 . 이 기사는 가설 검정 및 추정 (및 기타 여러 가지)에 대한 잦은 및 베이지안 접근 방식을 설명합니다. 이 기사의 프레임 워크는 풍경을 보려는 초보자에게 특히 유용 할 수 있습니다.


장과 기사의 제목을 포함하면 나중에 링크가 끊어 질 경우 도움이 될 수 있습니다.
Richard Hardy

8

이 질문은 의견에 기반을 둘 위험이 있으므로, 제 의견에 대해 간략히 말씀 드리고 책 제안을 드리겠습니다. 때로는 좋은 책이 필요한 접근법이기 때문에 특정 접근법을 취할 가치가 있습니다.

베이지안 통계가 더 직관적이라는 데 동의합니다. Confidence Interval과 Credible Interval의 구별은이를 요약 한 것입니다. 사람들은 당연히 Confidence Interval 방식보다는 "기회가 무엇인지 ..."라는 관점에서 생각합니다. Confidence Interval 접근 방식은 일반적인 원칙을 제외하고는 "95 % of time"에서 "95 % chance"까지 마지막 단계를 수행 할 수 없다는 점을 제외하고는 Credible Interval과 같은 말을하는 것처럼 들립니다. 할 수 없습니다. 일관성이없고 직관적이지 않습니다.

그 균형을 맞추는 것은 그들이 수강하는 대부분의 대학 과정이 덜 직관적 인 잦은 접근 방식을 사용한다는 사실입니다.

저는 Richard McElreath의 R과 Stan의 예제와 함께 통계적 재검토 : 베이지안 코스를 정말 좋아합니다 . 저렴하지 않으므로 구입하기 전에 그것에 대해 읽고 아마존에서 둘러보십시오. 베이지안 접근 방식을 활용하는 매우 직관적 인 접근 방식을 찾고 있으며 실습이 매우 쉽습니다. (R과 Stan은 베이지안 통계를위한 훌륭한 도구이며 무료이기 때문에 실용적인 학습입니다.)

편집 : 몇 의견은이 책은 아마도 경험이 풍부한 교사와 함께 고등학생을 넘어서는 것이라고 언급했습니다 . 따라서 더 큰주의를 기울여야합니다. 처음에는 간단한 접근 방식이 있지만 빠르게 증가합니다. 이 책은 놀라운 책이지만 실제로는 초기 가정에 대한 느낌과 얼마나 빨리 올라가는지를 느끼기 위해 아마존에서 실제로 그것을 찔러야 할 것입니다. 아름다운 비유, R에서의 훌륭한 실습, 놀라운 흐름과 조직, 그러나 당신에게는 유용하지 않을 수 있습니다.

프로그래밍 및 R (무료 통계 패키지)에 대한 기본 지식과 확률 및 통계의 기본에 대한 노출을 가정합니다. 랜덤 액세스가 아니며 각 챕터는 이전 챕터에서 빌드됩니다. 어려움은 중간에 증가하지만 매우 간단하게 시작합니다. 다단계 회귀로 끝납니다. 따라서 아마존에서 일부를 미리보고, 기본 사항을 쉽게 다룰 수 있는지 또는 너무 멀리 떨어져 있는지 판단 할 수 있습니다.

편집 2 : 내 기여의 결론은 순수한 견해에서 벗어나기 위해 좋은 교과서가 당신이 취하는 접근법을 결정할 수 있다는 것입니다. 나는 베이지안 접근법을 선호하며,이 책은 잘 작동하지만 너무 빠른 속도로 작동합니다.


2
McElreath의 책은 훌륭하지만 고등학생이 재능있는 교사와 함께 그 수준의 치료를 따를 수 있다면 정말 놀랄 것입니다.
DeltaIV

2
@DeltaIV : 좋은 피드백입니다. 답변을 편집하겠습니다. 나는 그것이 처음에 얼마나 읽기 쉽고 비유 적인지 여러 번 속았습니다. 그것은 중간 쯤에 가파른 학습 곡선으로 들어가고 아마도 그보다 훨씬 빠릅니다.
Wayne

1
또 다른 참고 사항 : 기본 (즉, 확률 이론)과 베이지안 방법에 대한 빈번한 방법의 응용 사이에는 더 큰 간격이 있다고 생각합니다. 즉, 가장 기본적인 Frequentist 절차에도 필요한 대학원 수준의 교육없이 MLE 이론, CLT 증명 등을 실제로 이해하는 사람을 상상하는 데 어려움을 겪고 있습니다. 조건부 확률을 알게되면 기본적으로 베이지안 추론의 작동 방식을 이해합니다. MCMC 이론은 약간 까다 롭지 만 솔직히 MLE 이론을 이해하는 것보다 솔직히 훨씬 간단합니다.
Cliff AB

... 그리고 베이지안 프레임 워크에서 통계의 확률과 적용 사이의 격차를 해소하는 것이 더 쉬워 지므로, 적어도 그것이 더 정신적으로 더 만족스러운 것으로 생각합니다. 나는 누군가의 과학적 호기심을 다소 죽이거나 훨씬 더 큰 정신적 헌신이 필요하다고 느꼈기 때문에 "우리를 믿어 라.
Cliff AB

... 그러나 mle 의 직관 은 자연 스럽습니다 ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen

5

먼저 잦은 접근 방식을 배운 다음 베이지안을 배웠습니다. 저는 전문 통계학자가 아닙니다.

나는 잦은 접근에 대한 나의 사전 지식이 베이지안 접근을 이해하는데 결정적으로 유용하다는 것을 알지 못했다는 것을 인정해야한다.

다음에 학생들에게 어떤 구체적인 응용 프로그램을 보여줄지, 그리고 얼마나 많은 시간과 노력을 들일지에 달려 있습니다.

이것을 말하면서, 나는 베이 즈부터 시작할 것입니다.


3

베이지안 프레임 워크는 일반적인 비판적 사고 기술과 밀접한 관련이 있습니다. 다음 상황에서 필요한 것입니다.

  1. 경쟁력있는 직업을 신청하는 것에 대해 생각합니다. 들어갈 확률은 무엇입니까? 신청하면 어떤 보상을받을 수 있습니까?
  2. 헤드 라인은 장기적으로 휴대 전화가 사람에게 암을 유발한다고 알려줍니다. 그들이 이것에 대해 얼마나 많은 증거를 가지고 있습니까?
  3. 가장 큰 효과를 내려면 어떤 자선 단체에 돈을 기부해야합니까?
  4. 누군가 당신에게서 $ 0.90와 $ 1.10 의 베팅으로 동전을 뒤집을 것을 제안 합니다. 그들에게 돈을 줄까요? 왜 안돼?
  5. 열쇠 (또는 원자 폭탄)를 잃어 버렸습니다. 어디서부터 시작합니까?

또한 이것은 두 개의 샘플 t-test : p에 대한 공식을 암기하는 것보다 훨씬 흥미 롭습니다. 따라서 학생들은 점점 더 많은 기술 자료를 다루기 위해 오랫동안 관심을 가질 가능성이 높아집니다.


3

베이지안 통계의 기초가되는 가능성에 대해서는 언급 한 사람이 없습니다. 베이 즈를 먼저 가르치는 것에 찬성하는 주장은 확률에서 가능성으로, 베이 즈로의 흐름이 매우 원활하다는 것입니다. 베이는 (i) 우도 함수가 확률 분포 함수처럼 보이고 (작용)하지만 곡선 아래 면적이 1.0이 아니고 (ii) 일반적으로 사용되는 원유 구간은 정규 분포에 비례하는 우도 함수를 가정하지만 베이지안 방법은이 한계를 쉽게 극복합니다.

베이 즈를 우선적으로 선호하는 또 다른 주장은 p- 값에 대한 P (A | B) 대 P (B | A) 우려가 다른 사람들이 언급 한 것처럼 더 쉽게 설명 될 수 있다는 것입니다.

"Bayes first"를 선호하는 또 다른 주장은 학생들이 조건부 확률 모델에 대해 더 신중하게 생각하도록 강요하는데, 이는 예를 들어 회귀 분석과 같은 다른 곳에서 유용합니다.

자체 홍보에 대해 죄송하지만 주제에 관한 것이기 때문에 이것이 Keven Henning과 정확히 일치하는 접근 방식이라고 언급하지는 않습니다 . 대상 독자가 통계학자가 아닌 wixsite.com/book-1 ).


2

당신은 재미와 통찰력 또는 실용적인 사용을 위해 가르치고 있습니까? 그것이 가르치고 이해하는 것에 관한 것이면, 나는 베이 즈에 갈 것입니다. 실용적인 목적을 위해 나는 Frequentist로 갈 것입니다.

많은 분야에서 자연 과학의 대부분의 분야에서 사람들은 논문을 p- 값으로 출판하는 데 익숙합니다. "소년들"은 다른 사람들이 자신의 글을 쓰기 전에 논문을 읽어야합니다. 적어도 내 분야에서 다른 사람들의 논문을 읽으려면 베이지안 연구 후에 그들이 얼마나 어리석은 지에 상관없이 귀무 가설을 이해해야합니다. 그리고 첫 번째 논문을 출판 할 준비가 되었더라도 팀을 이끄는 선임 과학자가있을 가능성이 높으며 기회주의자인 경우가 많습니다.

그러나 통계 재검토는 베이직 통계에 대한 첫 번째 접근 방식으로 매우 분명한 방법을 보여주고 Frequentism에 대한 기존 지식을 기반으로하지 않기 때문에 @Wayne과 동의하고 싶습니다. 이 책이 더 나은 통계와 더 나쁜 통계의 싸움에서 당신을 설득하려고하지 않는 것이 좋습니다. 베이 즈에 대한 저자의 언급 된 주장은 (IIRC) 그가 종류를 가르치고 있으며 베이 즈가 가르치기 쉽다는 것이다.


2

나는 베이지 안에서 멀리 떨어져서 거인들을 따라갈 것이다.

소비에트는 중고등 학생들을위한 훌륭한 책 시리즈를 가지고 있었고, " 'Quant'little library"로 대략 영어로 번역되었습니다. Kolmogorov는 "확률 이론 소개"라는 제목의 공동 저자와 함께 책을 기고했습니다. 나는 그것이 영어로 번역되었는지 확실하지 않지만 여기에 러시아 원본에 대한 링크가 있습니다.

그들은 조합을 통해 확률을 설명하는 데 접근합니다. 이 책은 적절한 수학 능력을 가진 고등학생에게 매우 접근이 용이합니다. 소비에트 사람들은 수학을 다소 광범위하게 가르쳤으므로 서양 고등학생들은 잘 준비되지는 않았지만 충분한 관심과 의지력으로 여전히 내용을 다룰 수 있다고 생각합니다.

내용은 학생들에게 매우 흥미 롭습니다. 무작위 걷기, 분포 제한, 생존 과정, 많은 수의 법칙 등이 있습니다.이 방법을 컴퓨터 시뮬레이션과 결합하면 훨씬 재미있어집니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.