중요하지 않은 효과 주위의 좁은 신뢰 구간이 널에 대한 증거를 제공 할 수 있습니까?


9

널을 거부하지 못하면 널이 참임을 암시한다고 가정하는 것은 명백하지 않습니다. 그러나 널이 거부되지 않고 해당 신뢰 구간 (CI)이 좁고 0을 중심으로하는 경우 이는 널에 대한 증거 제공하지 않습니까?

나는 두 가지 생각을하고있다. 그렇다. 실제로 이것은 효과가 거의 0이라는 증거를 제공 할 것이다. 그러나 엄격한 가설 검증 프레임 워크에서는 널 CI 효과는 해당 CI와 마찬가지로 추론에 사용할 수없는 것으로 보인다. 그렇다면 포인트 추정치가 중요하지 않은 CI의 의미는 무엇입니까? 또한 추론에 사용할 수 없거나 이전 예에서와 같이 널에 대한 증거를 정량화하는 데 사용할 수 있습니까?

학술적으로 언급 된 답변이 권장됩니다.


당신은 아마도 동등성 테스트와 그것을 자세히 설명하는 사이트의 질문에 관심이있을 것입니다 . 그룹 차이가없는 가설을 검정하는 방법을 참조하십시오 . 예를 들어.
Andy W

1
다른 대안에 대해 널 점에 대한 증거 의미한다면 ... 아니요. 관측 된 매우 작은 값과 널 사이의 셀 수없이 무한한 수의 대안은 여전히 ​​널보다 가능성이 높습니다. 다른 의미가 있다면, 아마도 어떤 상황에서는.
Glen_b-복지 주 모니카

그렇다면, 아직 들어 보지 못한 용어 인 동등한 테스트 문제 일 것입니다.
ATJ

답변:


6

한마디로 그렇습니다.

Andy W가 쓴 것처럼, 매개 변수 가 지정된 값과 같다는 결론을 내립니다 (귀하의 경우 효과 크기는 0 임)는 동등성 테스트의 문제입니다.

귀하의 경우,이 좁은 신뢰 구간은 실제로 효과가 실제로 0임을 나타내므로 동등성의 귀무 가설이 기각 될 수 있습니다. 에 상당한 등가1α수준은 일반적으로 일반으로 표시됩니다 12α-지정된 등가 간격 내에 완전히있는 신뢰 간격 이 등가 간격은 실제로 작은 편차를 무시할 수 있다는 것을 고려합니다. 즉,이 등가 간격 내의 모든 효과 크기는 실질적으로 동등한 것으로 간주 될 수 있습니다. (동일한 통계 테스트는 불가능합니다.)

자세한 내용은 Stefan Wellek의 "동등성 및 비열 등성에 대한 통계적 가설 테스트"를 참조하십시오.


2

귀무 가설은 "모든 모델이 잘못되었지만 일부는 유용합니다" 의 의미를 보여줍니다 . 문자 그대로하지 않을 경우 그들은 아마 가장 유용하다 입니다, 그것은 널의 인식 론적 목적을 기억하는 것이 중요 - 문맥. 그것이 의도 된 목적인 위조 될 수 있다면, 대안은 여전히 ​​정보가 없지만, 비교에 의해 더 유용해진다. 널을 거부하면 효과가 0이 아니라고 말하는 것입니다 (또는 널 가정은 위조를 위해 다른 값을 지정할 수도 있습니다).

계산하는 효과 크기는 모집단 모수의 가장 좋은 점 추정치입니다. 일반적으로 과대 평가 또는 과소 평가 될 가능성은 동일해야하지만 @Glen_b의 의견에서 알 수 있듯이 죽은 중심 불스 아이 일 가능성은 무한합니다. 기괴한 운명의 왜곡 (또는 구성에 의해 – 어느 쪽이든, 우리가 가정적으로 가정한다고 가정합니까?)0.0¯이는 신뢰 구간 내에서 매개 변수가 다른 값이 아니라는 증거가 아닙니다. 신뢰 구간의 의미는 위치 및 너비가 관련 방식으로 변경 될 수있는 경우를 제외하고는 가설 검정의 중요성에 따라 변경되지 않습니다.

귀무 가설이 문자 그대로 사실 인 (시뮬레이션 된) 모집단의 표본에 대한 효과 크기 추정치에 익숙하지 않은 경우 ), Geoff Cumming 's Dance of thep가치 . 그 신뢰 구간이 취향에 맞게 충분히 좁지 않은 경우 무작위로 생성 된 샘플을 사용하여 R에서 내 자신의 일부를 시뮬레이션하려고 시도했습니다.n=1M 각각에서 N(0,1). 나는 씨앗을 놓는 것을 잊어 버렸지 만이 대답을 마치기 전에 내가 돌보는 횟수만큼 설정 x=c()하고 실행 x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))하여 결국 6000 샘플을 얻었습니다. 여기서 히스토그램 및 사용 농도의 플롯 hist(x,n=length(x)/100)plot(density(x))각각은 :

    

예상 한 바와 같이, 문자의 효과가 전혀없는 모집단의 랜덤 표본에서 발생하는 다양한 영이 아닌 효과에 대한 증거가 있으며, 이러한 추정값은 실제 모수 ( skew(x)= -.005, kurtosis(x)= 2.85) 주위에 어느 정도 분포되어 있습니다 . 표본의 추정치 만 알고 있다고 상상해보십시오.n=1M, 실제 모수가 아닌 : 모수가 모수가 더 이상 추정치보다 0에 더 가까운 것으로 예상하는 이유는 무엇입니까? 신뢰 구간에는 널이 포함될 수 있지만, 널 효과는 반대 방향으로 샘플 효과 크기와 동등한 거리 값보다 실제로 그럴듯하지 않으며 다른 값, 특히 포인트 추정치보다 그럴듯합니다.

실제로 효과가 0보다 작다는 것을 증명하려면 무시하려는 경향이 얼마나되는지 정의해야합니다. 내가 시뮬레이션 한이 거대한 샘플을 사용하여 내가 생성 한 가장 큰 규모의 추정치는|r|=.004. 보다 현실적인 샘플로n=999, 내가 찾은 가장 큰 1M 샘플은 |아르 자형|=.14. 다시 말하지만, 잔차는 정규 분포를 따르므로 그럴 가능성은 없지만 요점은 타당하지 않습니다.

CI는 일반적으로 NHST보다 추론에 더 유용 할 것입니다. 매개 변수가 무시할 정도로 작다고 가정하는 것이 얼마나 나쁜 아이디어인지를 나타내는 것은 아닙니다. 매개 변수가 실제로 무엇인지에 대한 좋은 아이디어를 나타냅니다. 여전히 무시할 수 있는지 여부를 결정할 수 있지만 무시할 수없는 정도에 대한 감각을 얻을 수도 있습니다. 신뢰 구간의 추가 옹호에 대해서는 Cumming (2014 , 2013)을 참조하십시오 .

참고 문헌
-Cumming, G. (2013). 새로운 통계 이해 : 효과 크기, 신뢰 구간 및 메타 분석 . Routledge.
-Cumming, G. (2014). 새로운 통계 : 이유와 방법. 심리 과학, 25 (7), 7–29. http://pss.sagepub.com/content/25/1/7.full.pdf+html 에서 검색했습니다 .


고마워, 나는 커밍의 일에 매우 익숙하다. 나는? "요점은 추정, 다음의 CI는 유추를 사용할 수 있습니다 비 유효하다 ES 경우 (아니면 '널 (null)'즉, 점 추정치와 같은 쓸모없는)"내 질문에 더의 라인을 따라했다 가정
ATJ

1
@ATJ : 점 추정치 또는 (1α) 매개 변수의 신뢰 구간은 0과 크게 다르지 않으면 "무용지물"이됩니다 α) 또는 각각 0을 포함합니다.
Scortchi-Monica Monica 복원

@ATJ : 내가 말했듯이 CI의 의미 [/ 유틸리티]는 NHST의 중요성에 따라 변하지 않습니다. CI는 일반적으로 NHST보다 추론에 더 유용 할 것입니다. 매개 변수가 실제로 무엇인지에 대한 좋은 아이디어를 나타냅니다. 예를 들어 방금 실행 cor.test(rnorm(9999999),rnorm(9999999))하여 CI를 받았습니다.{0.00063,0.00060}. 따라서 다시 실행하면 해당 범위 내에서 새로운 예상치를 얻을 확률이 95 %라고 추론합니다. 다시 실행하면 내 예상은아르 자형=0.00029; CI 기반 추론이 옳았습니다! 널은 건설에 의한 것이지만, 내 증거는 대신 나의 추정을 선호 할 것입니다.
Nick Stauner
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.