우도 비율과 베이지안 모델 비교는 귀무 가설 검정에 대한 우수하고 충분한 대안을 제공합니까?


13

과학에 대한 귀무 가설 검정 (NHT)의 유용성을 누적 노력으로 비난하는 통계 학자와 연구원의 증가에 대응하여, 통계적 추론에 관한 미국 심리학 협회 태스크 포스는 NHT에 대한 명백한 금지를 피했지만 대신 연구원들에게 제안했다. NHT에서 파생 된 p- 값 외에 효과 크기를보고합니다.

그러나 효과 크기는 여러 연구에서 쉽게 축적되지 않습니다. 메타 분석 접근법은 효과 크기의 분포를 축적 할 수 있지만, 효과 크기는 일반적으로 주어진 실험 데이터에서 원시 효과 크기와 설명 할 수없는 "노이즈"사이의 비율로 계산됩니다. 즉, 효과 크기의 분포는 연구 전반에 걸쳐 영향의 원시 크기의 변동성뿐만 아니라 연구 전반에 걸친 소음의 표현의 변동성.

대조적으로, 효과 강도, 가능성 비율의 대안적인 측정은 연구별로 직관적 인 해석을 가능하게하며, 메타 분석을 위해 여러 연구에 걸쳐 쉽게 집계 될 수 있습니다. 각 연구에서 우도는 효과를 포함하지 않는 모형에 비해 주어진 효과를 포함하는 모형의 증거 가중치를 나타내며 일반적으로 "X의 효과에 대한 우도 비의 계산"으로보고 될 수 있습니다. "각 해당 null보다 효과에 대해 8 배 더 많은 증거를 보여 주었다". 또한, 1 이하의 가능성 비가 널이 선호되는 시나리오를 나타내고이 값의 역수를 취하면 효과에 대한 널의 증거의 가중치를 나타내는 한, 가능성 비는 또한 널 발견의 강도를 직관적으로 표현할 수있게한다. 특히 가능성 비율은 두 모델의 설명 할 수없는 분산의 비율로 수학적으로 표현되며, 이는 효과에 의해 설명 된 분산에서만 다르므로 효과 크기와 개념적으로 크게 다르지 않습니다. 다른 한편으로, 연구 간 효과에 대한 증거의 가중치를 나타내는 메타 분석 가능성 비율의 계산은 단순히 연구 간 가능성 비율의 곱을 취하는 문제입니다.

따라서 과학이 효과 / 모델을 선호하여 총 증거의 정도를 확립하려는 경우 가능성 비율이 나아갈 것이라고 주장한다.

효과의 특정 크기에서만 모델을 차별화 할 수있는 미묘한 경우가 있습니다.이 경우 데이터가 효과 매개 변수 값과 일치한다고 생각하는 구간의 표현이 선호 될 수 있습니다. 실제로 APA 태스크 포스는이를 위해 사용할 수있는 신뢰 구간보고를 권장하지만, 이것이 또한 고려되지 않은 접근법이라고 생각합니다.

신뢰 구간은 종종 학생과 연구원에 의해 잘못 해석 됩니다 . 또한 CI에 0을 포함시키는 것으로 NHT에서 사용할 수있는 능력이 NHT의 멸종을 추론으로 더욱 지연시키는 데 도움이 될 것입니다.

대신, 이론들이 효과의 크기에 의해서만 구별 될 수있을 때, 각 효과의 사전 분포가 각 모델에 의해 개별적으로 정의되고 결과적인 사후 분포가 비교되는 베이지안 접근법이 더 적절할 것을 제안합니다.

p- 값, 효과 크기 및 신뢰 구간을 가능성 비율로, 그리고 필요한 경우 베이지안 모델 비교로 대체하는이 접근법이 충분한 것으로 보입니까? 여기에 조정 된 대안이 제공하는 필요한 추론 기능이 누락 되었습니까?


더 집중된 질문이 될 수 있습니까? 아마도 특정 추론 문제에 대한 가능성 중심 접근 방식에 관한 것일까 요?
junctionprior

2
그러나 우리가 여기있는 동안 : 설명 : 전체 모델에 대한 비교 증거 측정을 위해 일반적으로 매개 변수로 식별되는 효과 크기 측정 값을 혼합 했습니까? LR은 후자의 후보처럼 보입니다. 또한 우도 함수를 단독으로 또는 조합하여 데이터가 모델에 대해 말하려는 모든 것을 알려면 기본적으로 베이지안입니다. 그것이 가능성 원칙이기 때문입니다. (물
켤레 이전

신뢰 구간 사용을 제안하거나 교체할지에 대한 귀하의 직책과 결론은 동의하지 않는 것 같습니다.
onestop

@ onestop : 사실, 나는 제목을 변경하는 것을 잊었다는 것을 깨달았습니다. 질문을 쓰는 동안 신뢰 구간에 대해 마음이 바뀌 었습니다. 제목을 편집했습니다. 혼란에 대한 사과.
Mike Lawrence

@Conjugate Prior : 첫 두 문장에 완전히 동의하십시오. 하지만 사전에 대한 아이디어가 마음에 들지 않고 가능성에 대한 기본 추론이 마음에 들지 않으면 베이지안이 아닌 가능성 원칙을 받아 들일 수 있습니다. Edwards books.google.com/books?id=2a_XZ-gvct4C 및 Royall books.google의 책을 참조하십시오. .com / books? id = oysWLTFaI_gC . 누군가 (그리고 나는 누구와 어디서 기억하는지)가 한 번이 계란을 깨는 오믈렛을 먹지 않는 것에 비유했지만.
onestop

답변:


3

적어도 심리학 연구원으로서 베이지안 접근법의 주요 장점은 다음과 같습니다.

1) 널에 찬성하여 증거를 축적 할 수 있습니다

2) 순차적 테스트의 이론적이고 실제적인 문제를 우회

3) 거대 N으로 인해 null을 거부하는 데 취약하지 않습니다 (이전 포인트 참조)

4) 작은 효과로 작업 할 때 더 적합합니다 (Frequentist와 Bayesian 방법 모두 큰 효과를 갖는 경우 항상 거의 동의하는 경향이 있습니다)

5) 실행 가능한 방식으로 계층 적 모델링을 수행 할 수 있습니다. 예를 들어, 다항식 처리 트리 모델과 같은 일부 모델 클래스에 항목 및 참가자 효과를 도입하려면 베이지안 프레임 워크에서 수행해야하며 그렇지 않으면 컴퓨팅 시간이 엄청나게 길어집니다.

6) "실제"신뢰 구간을 얻는다

7) 데이터의 가능성, 우선 순위 및 확률의 세 가지가 필요합니다. 첫 번째는 데이터에서, 두 번째는 구성하고, 세 번째는 전혀 비례하지 않아도됩니다. 좋아, 어쩌면 조금 과장 ;-)

전반적으로 귀하의 질문을 뒤집을 수 있습니다.이 모든 것이 고전적인 잦은 통계가 충분하지 않다는 것을 의미합니까? 나는 "아니오"라고 말하는 것이 너무 가혹한 평결이라고 생각합니다. p- 값을 넘어서서 효과 크기, 항목 효과의 가능성 및 일관된 결과를 일관되게 복제하면 (한 번의 실험이 너무 많은 논문이 출판 될 경우) 대부분의 문제는 다소 피할 수 있습니다.

그러나 Bayes로 모든 것이 그렇게 쉬운 것은 아닙니다. 중첩되지 않은 모델로 모델을 선택하십시오. 이러한 경우 사전 결과는 결과에 큰 영향을 미치기 때문에 매우 중요하며 때로는 사전을 올바르게 처리하기 위해 작업하려는 대부분의 모델에 대한 지식이 부족합니다. 또한, 시간이 오래 걸립니다 ....

나는 Bayes로 다이빙에 관심이있는 사람을 위해 두 가지 참고 문헌을 남깁니다.

Lee and Wagenmakers의 "인지 과학을위한 베이지안 그래픽 모델링 과정"

Ntzoufras의 " WinBUGS를 사용한 베이 시안 모델링"

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.