베이지안 통계가 통계 프로세스 제어에 더 인기가없는 이유는 무엇입니까?


18

베이지안 대 잦은 논쟁에 대한 나의 이해는 잦은 통계입니다.

  • 객관적이거나 주장
  • 또는 적어도 편견
  • 서로 다른 가정을 사용하는 다른 연구자들은 여전히 ​​정량적으로 비교 가능한 결과를 얻을 수 있습니다.

베이지안 통계

  • 사전 지식을 사용할 수 있기 때문에 "더 나은"예측 (즉, 예상 손실 감소) 주장
  • 최소한의 "임시"선택이 필요하며 (적어도 원칙적으로는) 실제 해석이 가능한 이전 / 모델 선택으로 대체합니다.

이를 감안할 때, SPC에서 베이지안 통계가 매우 인기가있을 것으로 기대했을 것입니다. 프로세스 품질을 제어하려고하는 공장 소유자 인 경우, 주로 예상 손실에 관심을 갖습니다. 이를 줄일 수 있다면 경쟁 업체보다 사전 / 지식이 많기 때문에 훨씬 좋습니다.

그러나 실제로 SPC에 대해 읽은 모든 것은 확고하게 빈번한 것으로 보입니다 (즉, 사전 분배, 모든 매개 변수의 포인트 추정치, 샘플 크기, p- 값 등에 대한 많은 임시 선택).

왜 그런 겁니까? 펜과 종이를 사용하여 SPC를 수행 한 1960 년대에 빈번한 통계가 더 나은 선택 인 이유를 알 수 있습니다. 그런데 왜 그때 이후로 다른 방법을 시도하지 않았습니까?


2
나는 베이 즈의 통계를 내 디지털 SLP 카메라로 생각하지만 아이폰 카메라만큼 자주 생각합니다. 나는 둘 다 언젠가 구입했지만 전화 휴식 95 % 동안 5 % 적은 사진의 DSLR을 사용합니다. 쉽고 편리하며 주머니에 담겨 있고 품질에 따라 많은 시간을 제공하기 때문입니다 (DSLR 기술 기반). 이전에 체인과 체인을 건초에 통합하는 것과 마찬가지로 조리개 개방 시간, 길이 및 기타 매개 변수의 최적 균형을 찾아야합니다. 인기의 아이폰 끝.
Ram Sharma

@ RamSharma 당신은 답변으로 게시해야합니다! 나는 요리사 칼 비유보다 그것을 좋아합니다.
shadowtalker

답변:


18

경고 나는 오래 전에 내가 무엇에 관해 이야기하고 있는지 거의 알지 못하고이 답변을 썼습니다. 승인되었으므로 삭제할 수 없지만 대부분의 콘텐츠 뒤에 숨을 수 없습니다.


이것은 매우 긴 답변이며 어떤 식 으로든 도움이되기를 바랍니다. SPC는 제 영역이 아니지만 이러한 의견은 여기에 적용 할 정도로 일반적이라고 생각합니다.

나는 가장 많이 인용 된 장점, 즉 이전의 신념을 통합 할 수있는 능력 은 약한 적용 / 임시적 분야 라고 주장한다 . 이전 을 수량화 해야하기 때문입니다. "음, 레벨 z는 확실히 믿어지지 않습니다"라고 말할 수 있더라도, z의 삶에서 z 아래에서 일어날 일을 말할 수는 없습니다. 작성자가 원시 데이터를 드라이브에 게시하기 시작하지 않는 한 이전 작업에 대한 최선의 추측은 이전 작업에서 가져온 조건부 모멘트입니다.

기본적으로 베이지안 기법 (적어도 개념적 수준에서)은 강력한 가정 / 아이디어 / 모델이 있고이를 데이터로 가져 오려는 경우에 탁월 합니다. 그러나 종종 비즈니스 프로세스에 대한 하나의 특정 모델에 대한 올바른지 여부를보고 싶어하지 않습니다. 더 가능성이 높습니다모델을 만들고 프로세스가 수행 할 작업을 찾고 있습니다. 결론을 내리지 않고 데이터가 결론을 내리기를 원합니다. 충분한 데이터가 있다면 어쨌든 이런 일이 일어날 것입니다. 그런데이 경우 왜 이전의 것을 귀찮게합니까? 어쩌면 그것은 지나치게 회의적이고 위험을 피할 수는 있지만 낙관적 인 사업가에 대해 들어 본 적이 없습니다. 자신의 신념에 대한 당신의 불확실성을 정량화 할 방법이 없으며 , 잘못된 것에 지나치게 확신 할 위험이 없습니다 . 따라서 정보를 미리 설정하지 않으면 이점이 사라집니다.

예를 들어 디지털 마케팅과 달리 비즈니스 프로세스 예측할 수없는 플럭스 상태에 있지 않기 때문에 이는 SPC 사례에서 흥미 롭습니다 . 비즈니스 프로세스가 고의적이고 점진적으로 변화하는 경향이 있습니다. 즉, 당신은 좋은 안전한 사전을 구축하는 데 오랜 시간이 걸립니다. 그러나 이전의 모든 것이 불확실성 전파에 관한 것임을 상기하십시오. 주관적 측면에서 베이지안주의는 깊이 중첩 된 데이터 생성 프로세스에서 객관적으로 불확실성을 전파 한다는 이점이 있습니다 . 즉, 나에게,이다 정말 무엇을 베이지안 통계 것이 좋습니다. 그리고 1-in-20 "유의"컷오프를 넘어서 공정의 신뢰성을 찾고 있다면 가능한 한 많은 불확실성을 설명하는 것처럼 보입니다.

베이지안 모델은 어디에 있습니까? 먼저 구현하기어렵습니다.. 솔직히 말해서, 나는 15 분 안에 기계 엔지니어에게 OLS를 가르 칠 수 있고 또 다른 5 번에 Matlab에서 회귀와 t- 테스트를 할 수 있습니다. 그런 다음 회사의 누군가가 알고있는 언어로 기성품 라이브러리가 있는지 확인하십시오. 그렇지 않으면 BUGS 또는 Stan을 사용해야합니다. 그런 다음 기본 답변을 얻기 위해 시뮬레이션을 실행해야하며 8 코어 i7 시스템에서 약 15 분이 걸립니다. 빠른 프로토 타이핑을위한 많은 것들. 두 번째로, 답변을받을 때까지 2 시간의 코딩과 대기 시간을 보냈으며 군집 된 표준 오류로 인해 자주 발생하는 무작위 효과와 동일한 결과를 얻었습니다. 어쩌면 이것은 모두 모호하고 잘못된 것이며 SPC를 전혀 이해하지 못합니다.

나는 베이지안을 매우 높은 품질의 요리사 칼, 스톡 포트 및 소테 팬에 비유합니다 . 빈번 함은 바나나 슬라이서와 같은 As-Seen-On-TV 도구로 가득 찬 주방 과 배수구를 쉽게 만들 수 있도록 뚜껑에 구멍이있는 파스타 포트와 같습니다 . 주방에서, 실제로 깨끗하고 체계적이고 모든 것이 어디에 있는지 알고있는 실질적인 지식을 가진 자신의 부엌에서 많은 경험을 가진 실습 요리사라면 작은 선택으로 놀라운 일을 할 수 있습니다 우아하고 고품질의 도구. 또는 사용하기에는 기술이 필요하지 않은 간단하고 실제로 반 나쁘지 않은 식사를 만들기 위해 몇 가지 다른 임시 도구를 사용할 수 있으며 몇 가지 기본 맛이 있습니다. 방금 데이터 광산에서 집으로 돌아 왔으며 결과에 굶주리고 있습니다. 당신은 어느 요리사입니까?

* Bayes는 애드혹과 동일하지만 덜 투명 합니다. coq au vin에 얼마나 많은 와인이 들어 갑니까? 당신은 프로이기 때문에, 당신은 그것을 안구. 또는 피노 그리지오와 피노 누아의 차이점을 알 수는 없지만 Epicurious의 첫 번째 레시피는 빨간색 컵 2 컵을 사용한다고 말했기 때문에 그렇게 할 것입니다. 어느 것이 "애드혹"입니까?


1
+1, 좋은 답변입니다. 궁금합니다 : 작은 / 적응 샘플 크기에 대한 단락을 추가 할 수 있습니까? SPC에서는 3-5의 표본 크기가 일반적으로 보입니다. 그리고 SPC 소프트웨어가 2 개의 샘플 이후에 기술자에게 실제로 3 개의 샘플이 더 필요한지 아닌지를 알려 주면 훌륭한 기능 이 될 것 입니다. 베이지안 모델을 사용하는 것은 거의 당연한 일입니다. 측정 비용, 오 탐지 및 음수를 정의한 다음 다른 측정을 수행하거나 중지하는 데 필요한 예상 비용을 추정하십시오. 빈번한 통계에서, 당신은 이상한 중지 규칙 효과를 다루어야 할 것입니다 (15 분 안에 ME에게 가르 칠 수 있습니까?)
nikie

1
표본 크기에 관해서는 문제가 있으며 표본이 작다는 것을 알고 있다면 이것을 언급했을 것입니다. 관찰이 거의 없으면 추정치가 이전의 선택에 매우 민감하다는 것 입니다. 당신은 돌에서 피를 얻을 수 없으므로, 그것은 절충입니다 : 당신은 빈번한 견적 자와 지나치게 과적 합하지만 거의 가정하지 않고 또는 자신의 지식 (또는 그 부족)을 충분히 모호한 사전에 통합합니다. 본질적으로 당신 앞에있는 데이터 당신의 머리에있는 "데이터" 에 모두 적합합니다 . 당신은 당신의 머리에 앞서 유니폼을 가질 수 있습니다.
shadowtalker 2016 년

1
기본적으로 Bayes는 처음부터 분석가에게 뇌를 사용하는 데 더 많은 부담을주었습니다. 나는 개인적으로 사전 설정에 대한 생각을 회피하는 것이 당신이 a) 너무 게 으르거나 b) 통계가 어떻게 작동하는지 이해하지 못한다는 것을 나타냅니다. 나는 내 대답에서 사전을 정량화하는 것이 어렵다고 말했다. 실제로는 실제로 동의하지 않습니다. 항상 할 수있는 한 가지 방법은 페이지에 종 곡선을 그리고 "내 데이터가 어떻게 보일까요?" 그렇지 않은 경우 커브 조정을 시작하십시오. 모드를 고수 할 위치를 결정할 수없는 경우 하이퍼 프리 어를 사용하십시오.
shadowtalker

2
한 가지 질문 (용감하지 않아야 함) : 이전의 믿음을 요구하는 (정량적으로) 문헌이 있다는 것을 알고 있습니까? 출판 된 신념, 인터뷰 한 전문가 및 비전문가 신념 및 자기 신념을 포함합니다. 내가 묻는 이유는 전에이 고소장을들은 적이 있었기 때문입니다. 그러나 그러한 고소장의 저자는 그들의 반론이 질문의 시작이 아니라 토론의 끝이라고 생각했습니다.
Alexis

1
@CliffAB 흥미로운… 나는 그 문헌을 깊이 읽지 못했습니다 (Bernardo, Kaas, Garthwaite ... 수십 년 전)… 그것은 당신을위한 가치있는 과학입니다. ;)
Alexis

5

나의 겸손한 의견으로는, 베이지안 통계는 (SPC에서뿐만 아니라 다른 연구 분야에서도) 널리 사용되는 것과 상충되는 몇 가지 단점이있다.

  1. 잦은 편에 비해 추정값을 얻는 것이 더 어렵습니다 (통계에 대한 클래스의 가장 넓은 부분이 빈번한 접근 방식을 채택합니다) 그러나 이것이 베이지안 통계의 제한된 인기의 원인인지 또는 효과인지 조사하는 것이 흥미로울 것입니다 ).

  2. 베이지안 통계는 종종 클릭 앤 보 (click-and-see )뿐만 아니라 동일한 문제를 처리하는 다양한 방법 (예 : 가장 좋은 방법은 무엇입니까?)에 대한 선택을 부과하는 경우가 많습니다 (어쨌든이 접근법은 잦은 틀에서 권장되지 않아야합니다).

  3. 베이지안 통계에는 경험이 적은 통계 학자 (예 : 부적절한 사전 ) 가 관리하기 어려운 일부 주제가 있습니다 .

  4. 그것은 필요 민감도 분석 의 누락 데이터 분석과 같은 몇 가지 주제를 만들어 (보통 빈도주의 프레임 워크에서 피할 수), 및 예외.

  5. 계산에 사용할 수있는 소프트웨어는 하나만 있습니다 (무료 다운로드 가능).

  6. 잦은 도구보다 Bayesian의 자율 연구원 이되는 데 더 많은 시간걸립니다 .


6
좋은 대답이지만 포인트 5에 동의하지 않습니다. 베이지안 분석을위한 다양한 (무료) 소프트웨어 인 WinBUGS, OpenBUGS, JAGS, Stan, PyMC 등을 생각할 수 있습니다. 더 많은 것이있을 것입니다. 내가 말하고자하는 것은이 모든 소프트웨어가 가파른 학습 곡선을 가지고 있으며 상당한 양의 프로그래밍과 통계 지식이 필요하다는 것입니다.
COOLSerdash

COOLSerdash는 옳으며 설명과 의견을 모두 환영합니다. 베이지안 분석 소프트웨어 목록 작성에 대한 포괄적 인 부족은 아마도 WinBugs에 대한 저의 친숙성 때문일 것입니다.
Carlo Lazzaro 2016 년

@CarloLazzaro 본인은 # 5에 대한 COOLSerdash의 요점에도 동의합니다. 버전 14부터 개인 라이센스가 있지만 주류 통계 패키지 Stata는 이제 베이지안 모델과 추정치를 바닐라 패키지에 통합합니다. 베이지안 계산 가용성은 증가 할 것이라고 생각합니다. 그러나 다른 요점들도 중요하며 베이지안 지지자들을위한 의제를 알려주는 데 도움이 될 것입니다.
Alexis

@Alexis : Stata 사용자 인 저는 최근의 베이지안 맛에 만족합니다. 좀 더 일반적인 생각으로, 나는 대학에서 통계 수업 중에 잦은 접근과 베이지안 접근을 모두 보증 할 것입니다.
Carlo Lazzaro

3

한 가지 이유는 베이지안 통계가 1990 년 경까지 주류에서 동결 되었기 때문입니다. 1970 년대에 통계를 연구 할 때 거의 모든 이단이되었습니다 (어디서나 대부분의 대학원 프로그램에서). 흥미로운 문제의 대부분이 다루기 힘들다는 사실은 도움이되지 못했습니다. 결과적으로 오늘날 통계를 가르치고 있으며 (저널 기사를 검토하고 커리큘럼을 디자인하는) 거의 모든 사람들이 빈번한 훈련을받습니다. SAS와 Stata와 같은 꾸러미에 점차적으로 적용되고있는 Markov Chain Monte Carlo (MCMC) 방법이 대중화되면서 1990 년 경에 상황이 바뀌기 시작했습니다. 개인적으로 나는 그들이 10 년 안에 훨씬 더 일반적 일 것이라고 생각하지만, SPC (specialized applications)에서는 그다지 유리하지 않을 수 있습니다.

베이지안 분석을보다 널리 이용할 수있게하는 한 그룹은 STAN 패키지 (mc-stan.org)를 개발하는 그룹입니다.


우리 사이트에 오신 것을 환영합니다! "STATA"가 아니라 "Stata"라는 점에 유의하십시오. 본인이 대문자로 입력했을 때 Stata 사용자가 잘못 사용하고 있습니다. (SAS, SPSS
등인 줄
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.