베이지안 통계가 점점 더 인기있는 연구 주제가되는 이유는 무엇입니까? [닫은]


10

100 대 미국 뉴스 통계 프로그램의 연구 영역을 살펴보면 거의 모두 베이지안 통계가 무겁습니다. 그러나 저학년 학교에가더라도 그들 대부분은 여전히 ​​고전적 / 자주적 통계 연구를하고 있습니다. 예를 들어, 현재 학교 (최상위 학교로 간주되지 않는 통계에 대한 QS 세계 순위에서 150에서 200 사이로 평가됨)에는 베이지안 통계에 중점을 둔 교수가 한 명 뿐이며 베이지안 통계에 대한 분노는 거의 없습니다. 내가 말한 일부 대학원생들은 베이지안 통계 학자들이 내가 당연히 동의하지 않는 베이 즈 통계를하고 있다고 말합니다.

그러나 이것이 왜 그런지 궁금합니다. 몇 가지 교육받은 추측이 있습니다.

(a) 고전 / 빈도 통계의 방법론 발전을위한 여지가 충분하지 않으며, 고전 / 빈도 통계 통계 연구에서 유일하게 가능한 연구는 상위 계층 학교가 더 많은 수준이어야하므로 하위 계층 학교의 주요 초점이 될 응용 프로그램에 대한 것입니다 이론적, 방법 론적 연구를 지향했다.

(b) 그것은 현장에 크게 의존한다. 통계의 특정 브랜치는 통계적 방법의 많은 과학적 적용과 같은 베이지안 통계에 더 적합하고 다른 브랜치는 재무 영역과 같은 고전 통계에 더 적합합니다. (내가 틀렸다면 바로 잡아라) 이것을 감안할 때, 최상위 계층 학교는 과학 분야에서 응용 프로그램을 수행하는 통계 능력이 많이있는 반면 하위 계층 학교 통계 부서는 주로 소득을 창출하는 데 도움이되므로 재무 영역에서 응용 프로그램에 집중하고 있습니다. 그리고 자금.

(c) MLE의 과적 합 등의 방법으로 해결할 수없는 잦은 방법에는 빈번한 방법이 있습니다. Bayesian은 훌륭한 솔루션을 제공하는 것 같습니다.

(d) 계산 능력이 여기에 있으므로 베이지안 계산은 30 년 전처럼 더 이상 병목 현상이 없습니다.

(e) 이것은 내가 가진 가장 의견이 많은 추측 일 수있다. 고전 통계학 자의 저항은 고전 통계의 역할을 능가 할 수있는 새로운 방법론을 좋아하지 않습니다. 그러나 Larry Wasserman이 말했듯이, 그것은 우리가하려는 일에 달려 있으며 모든 사람, 특히 연구원으로서 열린 마음을 유지해야합니다.


1
CV 이민자들의 의견은 다양 할 수 있으며, 이러한 의견은 주제를 벗어난 것으로 간주되지만 베이지안 분석에 관한 현대 텍스트의 서론 장에서 정확하게이 질문에 대한 답을 제시 할 가치가 있습니다. 특히, Gelman 등의 제 1 장 Bayesian Data Analysis 3rd Ed. 그것은 a) "상식"과 b) 99 %의 우리가 도울 수는 없지만 잘못 해석 할 수있는 문제가 많은 잦은 신뢰 구간으로 요약됩니다. 방법 우리는뿐만 아니라 GET-이동에서 베이지안 분석을 할 수 있도록 우리가 그것을 잘못 해석은 본질적으로 베이지안입니다.
피터 레오폴드

3
@ 피터 레오폴드 절반을 진지하게 : 99 %? "우리"는 누구입니까? 통계를 사용하는 많은 순진한 사용자는 실제로 CI에 대해 심각한 오해를 가지고 있지만 CV 커뮤니티를 다루는 경우 99 %가 실제로 적합하지 않기를 바랍니다. 통계적인 사람들은 하드 데이터가 없을 때 다른 사람들만큼이나 나쁜 숫자가 될 수 있습니다!
Nick Cox

@NickCox 나는 OP를 다루고 있었고 "우리"는 공감하고 포용 적입니다. "99 %"는 대략 10 배 정도의 크기로 인식되기를 바랍니다.102. 그것은 또한 대중 문화에서 트로피를 가지고 있거나 가지고 있지 않은 것의 더 큰 부분입니다. 이 맥락에서 가지고 있지 않은 것은 다음과 같은 사건을 나타냅니다. 대 믿을만한 간격 " 그리고 지금 당신이 저를 부르셨으므로, 나는 그 사건에 대한 나의 공식적인 공식임을 (: D) 주장 할 것입니다! 당연히 나는 다른 방법으로 확신 할 수 있습니다! : D
Peter Leopold

답변:


8

개인적으로, 나는 몇 가지 추측을 할 것입니다 :

(1) 베이지안 통계는 지난 수십 년 동안 큰 인기를 끌었다. 이 중 일부는 MCMC의 발전과 전산 자원의 개선 때문이었습니다. 베이지안 통계는 이론적으로는 정말 훌륭하지만 장난감 문제에만 적용 할 수있는 접근 방식에 적용 할 수 있습니다. 이것은 몇 년 전 Bayesian 통계에 대해 작업했다고 말하면 아마도 당신을 매우 경쟁력있는 고용으로 만들었습니다.

이제 베이지안 통계는 여전히 플러스라고 말하지만 베이지안 방법을 사용하지 않고 흥미로운 문제에 대해 연구하고 있습니다. 부족 베이지안 통계의 배경은 확실히 대부분의 고용위원회에 마이너스가 될 것이지만, 베이지안 방법에서 충분한 교육을받지 않은 통계에서 박사 학위를 얻는 것은 매우 놀라운 일이 될 것입니다.

(2) 베이지안 통계 학자들은 이력서에 "베이지 아"를 언급 할 것이다. 상용 주의자는 일반적으로 자신의 이력서에 "자주주의"를 두지 않고 훨씬 더 일반적으로 그들이 일하는 영역 (즉, 생존 분석, 예측 모델링, 예측 등)을합니다. 예를 들어, 제 작업 중 많은 부분이 최적화 알고리즘을 작성하는 것입니다.이 알고리즘은 Frequentist 작업을 수행한다는 것을 의미한다고 생각합니다. 나는 또한 베이지안 알고리즘의 공정한 덩어리를 작성했지만 확실히 내 작품의 소수입니다. 베이지안 통계는 이력서에 있으며, 상용 통계는 아닙니다.

(3) 어느 정도까지, 당신이 당신의 질문에서 말한 것도 진실을 담고 있습니다. 효율적인 일반 베이지안 계산에는 빈번한 영역보다 더 많은 열린 문제가 있습니다. 예를 들어, Hamiltonian Monte Carlo는 최근 Bayesian 모델에서 일반적으로 샘플링하기위한 매우 흥미로운 알고리즘이되었습니다. 일반 개선의 여지가 많지 않습니다.요즘 최적화; Newton Raphson, L-BFGS 및 EM 알고리즘은 많은 기반을 다룹니다. 이러한 방법을 개선하려면 일반적으로 문제를 많이 전문화해야합니다. 따라서 "고차원 최대 가능성 추정에서 작업"보다는 "지리 공간 모델의 고차원 최적화 작업"이라고 말하고 싶습니다. 머신 러닝 세계는 새로운 확률 론적 최적화 방법 (SGD, Adam 등)을 찾는 데 많은 흥분이 있기 때문에 약간의 예외가 있지만 몇 가지 이유로 약간 다른 짐승입니다.

마찬가지로, 모델에 대한 선행 우선 순위를 제시하기 위해 수행해야 할 작업이 있습니다. 빈번한 방법 이것과 동등하지만 (예 : LASSO, glmnet)

(4) 마지막으로, 이것은 분명 개인적인 견해이며, 많은 사람들이 Frequentist를 p-value와 연관시킵니다. 다른 분야에서 관측 된 p- 값의 일반적인 오용을 감안할 때 많은 통계 학자들은 현재 p- 값의 오용으로부터 가능한 한 멀리 떨어져 있기를 원할 것입니다.


3
따라서 왜 인기가 높아지는 지에 대한 답은 (1) 인기가 높아지는 것입니다. 그것에 의아해하지만, 나는 그것이 약간의 단어 변경이 필요한 문제라고 생각합니다.
Nick Cox

@NickCox : 내 지점이 있다는 것입니다 이다 더 인기뿐만 아니라, 그것의 인기가 다소 과장 될 수 있습니다. 즉, OP는 베이지안 통계가 최상위 대학의 샘플에서 거의 모든 교수의 이력서에 있음을 알았습니다. 그렇다고해서 모든 교수가 베이지안 통계 만하는 것은 아닙니다. (1)의 또 다른 요점은 베이지안 통계를 수행 할 때 연구 분야가 최상위 순위를 얻는 데 매우 중요했기 때문에 시간 있다고 생각했습니다 . 나는 그것이 더 이상 요구 사항의 엄격한 지 확신하지 못하지만, 지금 당신이 보는 많은 교수들이 그 기간 동안 고용되었습니다.
Cliff AB

오, 당신의 요점을 참조하십시오. 나는 "고전 / 자주 통계에서 발전 할 여지가 충분하지 않기 때문입니까?"에 대한 토론에 집중하고있었습니다. "왜 이런 일이 일어나고 있습니까?"
Cliff AB
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.