"조사자 의도"및 임계 값 / p- 값


21

John Kruschke의 "Doing Bayesian Data Analysis"슬라이드를 읽고 있지만 실제로 t- 검정 및 / 또는 전체 귀무 가설 유의성 테스트 프레임 워크에 대한 그의 해석에 대한 질문이 있습니다. 그는 p- 값이 조사자의 의도에 의존하기 때문에 잘못 정의되어 있다고 주장한다.

특히, 그는 두 치료법을 비교하는 동일한 데이터 세트를 수집하는 두 실험실의 예 (3-6 페이지)를 제공합니다. 한 실험실은 12 명의 피험자 (조건 당 6 명)로부터 데이터를 수집하고 다른 실험실은 정해진 기간 동안 데이터를 수집하며, 12 명의 피험자가 생성됩니다. 슬라이드에 따르면 의 임계 값 은 다음 두 데이터 수집 체계에서 서로 다릅니다. 전자는 이지만 후자는 입니다. !p < 0.05 t 치명타 = 2.33 t 치명타 = 2.45tp<0.05tcrit=2.33tcrit=2.45

내가 지금 찾을 수없는 블로그 게시물은 고정 기간 시나리오가 11, 13 또는 다른 수의 주제에서 데이터를 수집 할 수 있었기 때문에 고정 기간 시나리오의 자유도가 더 높다고 제안했다. 정의는 입니다.N=12

누군가 나에게 설명해 주시겠습니까?

  • 이러한 조건에서 임계 값이 다른 이유는 무엇입니까?

  • (문제라고 가정) 다른 정지 기준의 영향에 대한 수정 / 비교는 어떻게합니까?

유의성 (예 : 까지의 샘플)을 기반으로 중지 기준을 설정하면 유형 I 오류의 확률이 증가 할 수 있지만 중지 규칙은 결과에 따라 달라지지 않으므로 여기서는 진행되지 않는 것으로 보입니다. 분석.p<0.05

답변:


11

자세한 내용은 다음과 같습니다. http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

보다 완전한 논의는 여기에 제공됩니다 : http://www.indiana.edu/~kruschke/BEST/ 이 기사는 임계 값 N에서 중지, 임계 값 지속 시간에서 중지 및 임계 값 t 값에서 중지하기위한 p 값을 고려합니다.


와우! 말의 입에서 똑바로 ... 그것은 나에게 일어나지 않은 흥미로운 아이디어입니다. 추가 정보에 감사드립니다.
매트 크라우스

나는 이것이 Kruschke 박사의 (11 장) 에서 길게 논의되고 있다고 덧붙이고 싶었다 .
매트 크라우스

13

: 드디어 슬라이드와 관련된 종이 아래로 추적 Kruschke (2010) , 직접 (CiteSeerX를 통해) 저자도 가능 여기를 저널 널리 실시되지 않기 때문에. 그 설명은 약간의 prosaic이지만, 나는 아직도 그것을 구입 확신하지 않습니다.

고정 -N의 경우 임계 값은 다음과 같이 계산됩니다. (동일한) 모집단에서 샘플이 무작위로 추출되고 값이 계산됩니다. 이 프로세스는 널 분배를 빌드하기 위해 여러 번 반복됩니다. 마지막으로 는 해당 분포의 95 번째 백분위 수로 설정됩니다.2 N t t c r i tt2Nttcrit

고정 기간의 경우, 대상은 평균 rate 도달한다고 가정합니다 . 널 분포는 두 단계를 반복하여 구성됩니다. 첫 번째 단계에서 각 조건 및 대한 주제 수는 매개 변수 분포에서 가져옵니다 . 다음으로 및 랜덤 드로우를 사용하여 값 을 계산합니다 . 이것은 여러 번 반복되며 는 해당 분포의 95 번째 백분위 수로 설정됩니다.N 1 N 2 λ N 1 N 2 t t c r i tλN1N2λN1N2ttcrit

이것은 조금 건방진 것 같습니다. 내가 알기로, 단일 분포 가 없다 ; 대신, 자유도 모수에 의해 부분적으로 결정된 형태를 갖는 분포의 분포입니다. 고정 조건의 경우, 그룹당 피험자 가 있고 짝을 이루지 않은 t- 검정에 대한 적절한 값은 자유도를 가진 것입니다. 이는 아마도 그의 시뮬레이션이 재현하는 것입니다. N N t 2 N 2tNNt2N2

다른 조건에서, " "와 같은 분포는 실제로 특정 추첨에 따라 많은 다른 분포에서 나온 표본의 조합 인 것처럼 보입니다 . 을 설정 하면 평균 자유도가 될 수는 있지만 충분하지 않습니다. 예를 들어, 및 에 대한 분포 의 평균은 3 자유도를 갖는 분포 가 아닌 것 같습니다 .t λ = N 2 N N t ν = 1 ν = 5 tttλ=N2NNtν=1ν=5t

요약해서 말하자면:

  • 저자는 CDF에서 계산하는 대신 시뮬레이션으로 을 생성 했습니다.tcrit
  • 이 대응의 꼬리 풍부하게 할 수처럼 저자가 고정 기간 시나리오를 시뮬레이션하는 방법은 보인다 - 분포를.t
  • 나는 이것이 실제로 문제라는 것을 확신하지 못하지만, 다른 사람이 생각하면 답변을 읽거나 찬성 / 수락하는 것이 기쁠 것입니다.

왜 자신의 질문에 대답하고 확인 표시를 할 수 있습니까? 당신은 자신에게 담당자를 줄 수 있어야하는 것 같지 않습니다!
Michael R. Chernick

5
마이클 자신의 질문대답하는 것은 잘못된 일이 아닙니다 .
chl

@ MichaelChernick, 나는 당신이 당신의 자신의 답변을 수락하면 아무런 대답을 얻지 못한다고 생각합니다. 그 당시에는 2 주간에 답을 추적 했으므로 옳은 일처럼 보였지만 John K. Kruschke의 대답을 분명히 인정했습니다. 슬라이드 :-)
Matt Krause

흥미로운 감사합니다. 그러나 나는 그것이 정확하고 최선 인 것처럼 보이더라도 언제든지 자신의 답변을 확인 해야하는 이유를 알지 못합니다. 우리는 당신의 자신의 답변을 확인한다고 rep 포인트를 제공하지 않습니다.
Michael R. Chernick

3
답변을 수락 된 것으로 표시하는 것은 올바른 해결책 (나중에 방문자를위한), 특히 다른 제안이없는 곳을 나타내는 것 외에 다른 목적이 없기 때문에 문제가 없습니다. 개인적으로, 나는 OP가 우리 자신의 연구로부터 이익을 얻을 수 있음을 이해하기 때문에 오래 전에이 답변을 찬성했습니다. 이 스레드를 따르고 그의 결정을 업데이트한다는 간단한 사실에 대해 추가 투표를 할 수 없어서 정말 죄송합니다. 추신 "우리는 설립했다 ..."는 왜 자신에게 평판을 줄 수 있는가? .
chl
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.