베이지안처럼 생각하고, 잦은 주의자처럼 확인하십시오 : 그게 무슨 뜻입니까?


35

여기에서 찾을 수있는 데이터 과학 과정에 대한 강의 슬라이드를보고 있습니다.

https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf

안타깝게도이 강의에 대한 비디오를 볼 수 없으며 슬라이드의 어느 시점에서 발표자가 다음과 같은 텍스트를 가지고 있습니다.

일부 주요 원칙

베이지안처럼 생각하고, Frequentist처럼 확인하십시오 (조정)

그게 실제로 무엇을 의미하는지 아는 사람이 있습니까? 이 두 가지 생각 학교에 대해 좋은 통찰력이 있다는 느낌이 듭니다.


2
모델 검사와 관련이있을 수 있습니다 . 베이지 안에서 잔차를 볼 수없는 이유는 무엇입니까?를 참조하십시오 . .
Scortchi-Monica Monica 복원

@Scortchi 내가 수집 한 것에서 이것은 훈련, 유효성 검사 및 테스트 데이터 세트를 분리하는 것과 관련이 없거나 Bayesian이 모델의 훈련 단계에서도 사전 조건을 조정할 수 없습니다 (ML 용어 사용) 이리). 그러나, 나는 아직도 빈번한 수표처럼 수표에 의해 무슨 뜻인지 혼란스러워합니다.
Luca

1
"적절한"Bayesian은 사전을 조정하지 않지만 Bayes '정리를 사용하여 새로운 정보에 따라 업데이트합니다. 그러나 나는이 "핵심 원칙"이 무엇에 관한 것 일지 추측하고 있습니다.
Scortchi-Monica Monica 복원

4
링크를로드 할 수 없습니다. 제 생각에는 베이 즈 방법을 사용하더라도 빈번한 작동 특성에주의해야한다는 것입니다. 95 % 신뢰할 수있는 간격이 매우 빡빡하지만 실제로 20 %의 실제 관심 매개 변수를 다루는 경우, 걱정해야합니까? 지나치게 딱딱한 베이지안은 "아니오"라고 말할 수 있습니다 (그러나 그러한 강성을 가진 베이지안은 거의 없습니다).
Cliff AB

3
미래의 슬라이드를 기대하면서 Empirical Bayes를지지하고 있습니다. 이것은 다음 슬라이드 세트에서
Cliff AB

답변:


32

베이지안과 빈번한 통계 학교의 주요 차이점은 확률 해석의 차이로 인해 발생합니다. 베이지안 확률은 사건이 일어날 것이라는 개인적인 신념에 대한 진술입니다. 잦은 확률은 해당 사건의 수가 증가함에 따라 한계에서 발생하는 유사한 사건의 비율에 대한 진술입니다.

저에게 "베이지안처럼 생각한다"는 것은 새로운 정보가 발생할 때 개인의 신념을 업데이트하고 "빈번 주의자처럼 [또는 걱정]을 확인"한다는 것은 해당 절차가 사용 된 시간에 걸쳐 집계 된 통계적 절차의 수행에 관심이 있다는 것을 의미합니다. 예를 들어, 신뢰할 수있는 구간의 적용 범위, 유형 I / II 오류율 등


1
답변 주셔서 감사합니다. 나처럼 평신도에게도 간결하고 효과적입니다!
Luca

2
사전의 영향을 조사하거나 정보가없는 것을 사용하여 베이지안처럼 확인하거나 걱정할 수 없습니까? 순차 분석에만 적용 할 수 있습니까? Bayesian 및 Frequentist 통계가 순차적 분석과 교차하는 위치에 대한 많은 연구가 있었으며, "신념 업데이트"가 필수적이지 않으며, 잦은 설정에서 중요 통계를 엄격하게 만들 수 있습니다.
AdamO

1
예. 예전의 영향을 조사하는 것과 같이 베이지안처럼 걱정할 수 있습니다. 아니요, 제 답변은 순차적 분석에만 적용되는 것이 아니라 새로운 정보가 한 번에 발생할 수 있습니다.
jaradniemi

15

베이지안 통계는 신념을 요약하지만 빈번한 통계는 증거를 요약합니다. 베이지안은 확률을 신념의 정도로 본다. 이 포괄적이고 생성적인 추론 유형은 가설을 공식화하는 데 유용합니다. 예를 들어, 베이지안은 우주 비행사가 실제로이를 확인하기 위해 그곳을 여행 할 수 있었는지 여부에 관계없이 달이 녹색 치즈로 만들어 졌다는 개념에 임의로 확률을 할당 할 수 있습니다. 이 가설은 아마도 멀리서 달이 보인다 는 생각에 의해 뒷받침 될 것입니다그린 치즈 처럼요 빈번한 사람들은 밀짚 꾼 이상의 가설을 단념 적으로 생각할 수 없으며, 어떤 가설이 다른 가설보다 우위에 있다고 말할 수도 없습니다. 최대 우도조차도 "관찰 된 것과 가장 일치하는"통계량 만 생성합니다. 공식적으로 베이지안 통계를 통해 우리는 상자 밖에서 사고하고 데이터로부터 방어 가능한 아이디어를 제안 할 수 있습니다. 그러나 이것은 본질적으로 본질적으로 생성되는 가설입니다.

빈번한 통계는 가설을 확인하는 데 가장 적합합니다. 실험이 잘 수행 될 때, 빈번한 통계는 소거 이전의 결과에 의해 "독립적 관찰자"또는 "임시적"맥락을 제공한다. 이것은 칼 포퍼 과학 철학과 일치합니다. 증거의 요점은 특정 아이디어를 공표하는 것이 아닙니다. 많은 증거가 잘못된 가설과 일치 합니다. 증거는 단지 신념을 위조 할 수 있습니다.

이전의 영향은 일반적으로 통계적 추론의 편견으로 간주됩니다. 아시다시피, 우리는 일이 일어나는 이유를 많이 만들 수 있습니다. 심리적으로 많은 사람들은 우리의 관찰자 편견이 우리가 보는 것에 진정으로 가중치를 부여하지 못하게하는 뇌의 이전 결과라고 생각합니다. 목사 어머니가 모래 언덕에서 말했다시피 "희망 구름 관찰". 포퍼는이 아이디어를 엄격하게 만들었습니다.

이것은 우리 시대의 가장 위대한 과학 실험에서 역사적으로 매우 중요했습니다. 예를 들어, 존 스노 꼼꼼하게 콜레라 전염병에 대한 증거를 수집하고 콜레라가되어 기민하게 체결 되지 도덕적 결핍에 의해 발생하고, 증거가 하수 오염이 매우 일치 함을 지적했다 : 노트 그는하지 않았다 결론이로 인해 스노우의 발견은 박테리아의 발견을 앞질렀 고, 기계적인 또는 어원 학적 이해는 없었다. 종의 기원에서도 비슷한 담론이있다. 우주 비행사가 실제로 표면에 착륙하여 샘플을 수집 할 때까지 달이 녹색 치즈로 만들어 졌는지 실제로 알지 못했습니다. 이 시점에서 베이지안 후부들은 다른 가능성에 대해 매우 낮은 확률을 할당했으며, Frequentists는 기껏해야 샘플이 달 먼지를 제외한 모든 것과 일치하지 않는다고 말할 수 있습니다.

요약하면, 베이지안 통계는 가설 생성에 적합하고 잦은 통계는 가설 확인에 적합합니다. 이러한 노력에서 데이터가 독립적으로 수집되도록하는 것은 현대 통계학자가 직면 한 가장 큰 과제 중 하나입니다.


1
답변 해주셔서 감사합니다. 당신이 말할 때 무엇을 의미 했습니까 Plenty of evidence is consistent with incorrect hypotheses.
Luca

2
@Luca 일반적인 통계적 예가 혼란 스러울 수 있습니다. 예를 들어, "흡연은 청소년들에게 더 나은 폐 기능을 제공합니다"라고 말할 수 있습니다. 나는 흡연이 더 나은 신체 활동, 더 건강한 식욕을 장려하고 건강한 사회화를 장려하는 자극제라고 말함으로써 이것을 합리화 할 수 있습니다. 데이터를 수집하면 실제로 흡연 하는 청소년의 폐 기능이 더 우수 하다는 것을 알 수 있습니다. 연관 결론은 정확하지만 인과 결론은 거짓입니다. 나이가 많은 아이들은 담배를 피울 가능성이 높기 때문에 관계는 나이에 따라 혼란스러워합니다.
AdamO

고맙습니다! 나는이 매우 잘 작성된 답변에서 많은 것을 배웠습니다.
Luca

5

Cliff AB그들이 경험적 베이지안 철학으로 향하고있다처럼 영업 이익의 의견 들린다. 베이지안의 세 가지 주요 학교가 있으며 Empirical Bayes 는 종종 빈번한 방법으로 데이터로부터 사전을 추정합니다. 그것은 인용문과 정확히 일치하지는 않지만 (이후 베이 즈가 앞뒤로 자주 제기되는 관심사를 암시 함) 우리는 Cliff AB훌륭한 의견을 간과해서는 안됩니다 .

또한 베이지안 학교가 있었지만 여전히 베이지안 절차 후에는 아무것도 점검 할 필요가 없다고 생각했습니다. 더 현대적인 생각은 사후 예측 검사를 사용하며 아마도 이중 답변 귀하의 답변에 대한 접근 방식이 인용문이 말하는 것입니다.

또한 잦은 철학은 데이터의 추론보다는 절차와 관련이 있습니다. 아마도 그것은 또한 인용의 의미에 대한 단서 일 것입니다.


나는 당신이 나의 첫번째 의견을 언급했다고 생각합니다. 그리고 나의 두번째 의견은 면밀히 조사한 후에 그들이 구체적으로 경험적 베이 즈를 언급하고 있다는 것이 옳았습니다. 나는이 인용문이 단순히 두 생각 학교의 장점을 고려하기위한보다 일반적인 요구 라기보다는 단순히 경험적 베이 즈의 보증이라는 것에 실망했다. 오 잘
Cliff AB

2

이 데이터 과학 수업의 맥락에서, "빈번주의처럼 확인"에 대한 나의 해석은 보류 된 유효성 검사 데이터에 대한 예측 기능 또는 의사 결정 기능의 성능을 평가한다는 것입니다. "베이지안처럼 생각하기"에 대한 조언은 베이지안 접근 방식에서 파생 된 예측 함수가 일반적으로 좋은 결과를 줄 것이라는 의견을 나타냅니다.


베이지안 접근 방식이 왜 "좋은 결과"를 제공하고 빈번하지 않아야 하는가?
Tim

베이지안 방법은 접근 방식에 대해 규범 적입니다. 빈번한 통계는 의사 결정 이론의 일부로 볼 수 있으며 모든 베이지 색 기능이나 베이직주의 원칙에 따라 결정 기능을 평가하는 프레임 워크를 제공합니다. 최대 우도 방법과 같은 특정 방법은 종종 잦은 속성을 가지기 때문에 잦은 상황에서 자주 사용됩니다 (예 : 무의식적으로 올바른 일을하고 대부분의 다른 방법보다 더 빨리 도착합니다). 베이지안 방법은 종종 잦은 주의자에 의해 사용될 수 있지만 사용 방법이 다른 이유가 있습니다.
DavidR

베이지안 방법은 의사 결정 이론과 공통점이 많습니다. 또한 베이지안 방법을 잦은 맥락에서 사용할 수 있다고 생각 하지 않습니다 (빈번한 상황에서 사전을 사용하는 방법을 어떻게 생각하십니까?). 나는 이것에 대해 논할 점이 없다고 생각합니다. 나는 당신의 진술이 약간 지나치게 단순화했다고 말합니다.
Tim

베이지안 접근 방식에 대한 많은 빈번한 속성을 증명할 수 있으므로 충분한 의미가있는 한 베이지안을 수행하는 것이 꽤 안전합니다.
DavidR

1
코인 플립으로 헤드의 확률 p를 추정하고 싶다고 가정 해보십시오. 베이지안으로서, 나는 확률 p에 대해 사전에 시작하고, 약간의 데이터를 관찰 한 다음, p에 사후를 얻을 것이다. 우리는 p의 점 추정치를 생각해 내야하고, 나의 사후 분포의 평균을 나의 점 추정치로 사용하기로 선택합니다. 모두 말해, 이것은 데이터에서 포인트 추정치로 이동하는 방법을 설명합니다. 이 방법은 빈번한 방식으로 평가할 수 있습니다. 예 : 편향되어 있습니까? 일관된? 무조건 효율적입니까? 이전과 관련된 사실은 그 자체로 잦은 주의자와 관련되어서는 안됩니다.
DavidR

1

"베이지안처럼 생각하고, 잦은 주의자처럼 확인"하는 것은 통계 설계 및 분석에 대한 접근 방식을 나타냅니다. 내가 이해하는 것처럼 베이지안 사고는 이전의 상황 (실험적으로 또는 통계적으로)에 대한 약간의 신념을 포함합니다. . 이들은 이전 연구와 가설에 근거한 신념입니다. 빈번한 사고는 개입의 결과를 추정하여 이론적, 실제적인 빈도 또는 이러한 결과가 다시 발생할 확률 (즉, "빈번한")에 기반한 신뢰 구간 또는 기타 통계를 얻습니다. 예를 들어, 중재 후 읽기 점수는 분당 85 ~ 97 단어의 95 % 신뢰 구간을 갖는 분당 91 워드 일 수 있으며 이와 관련된 p- 값 (확률 값)은 중재 전 점수와 다릅니다. 따라서 시간의 95 %에서 새로운 읽기 점수는 중재 후 분당 85 ~ 97 단어입니다. 따라서 "베이지안처럼 생각"-즉, 이론, 가설, 이전 증거를보고 "빈번 주의자처럼 확인"-즉, 이러한 실험 결과가 얼마나 자주 발생하며 얼마나 많은 결과가 발생할 수 있는지 개입보다는 기회. 새로운 읽기 점수는 중재 후 분당 85 ~ 97 단어입니다. 따라서 "베이지안처럼 생각"-즉, 이론, 가설, 이전 증거를보고 "빈번 주의자처럼 확인"-즉, 이러한 실험 결과가 얼마나 자주 발생하며 얼마나 많은 결과가 발생할 수 있는지 개입보다는 기회. 새로운 읽기 점수는 중재 후 분당 85 ~ 97 단어입니다. 따라서 "베이지안처럼 생각"-즉, 이론, 가설, 이전 증거를보고 "빈번 주의자처럼 확인"-즉, 이러한 실험 결과가 얼마나 자주 발생하며 얼마나 많은 결과가 발생할 수 있는지 개입보다는 기회.


2
마지막 문장- "빈번주의와 같은 점검"부분은 빈번한 설정과는 전혀 관련이 없습니다. 베이지안 추정은 우리가 "얼마나 자주 발생하는지"또는 "어떻게"일어날 것인지를 알려줍니다.
Tim
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.