2.04 표준 오류의 의미? 신뢰 구간이 광범위하게 겹치는 경우의 의미가 크게 다른가?


10

아래 이미지는 심리학 의이 기사 에서 가져온 것 입니다. 한 동료가 그것에 대해 두 가지 특이한 점을 지적했습니다.

  1. 캡션에 따르면 오차 막대에 "± 2.04 표준 오차, 95 % 신뢰 구간"이 표시됩니다. 95 % CI에 ± 1.96 SE가 사용 된 것을 보았으며 어떤 목적 으로든 2.04 SE가 사용되는 것을 찾을 수 없었습니다. 2.04 SE에는 어떤 의미가 있습니까?
  2. 본문은 계획된 쌍별 비교가 오류 대 정확한 예측 가능한 시행 (t (30) = 2.51, p <.01)과 오류 대 정확한 예측할 수없는 시행 (t (30) = 2.61, p <.01) (옴니버스 F 테스트도 p <.05에서 유의미했습니다). 그러나 그래프는 세 가지 조건 모두에 대해 실질적으로 겹치는 오차 막대를 보여줍니다. ± 2.04 SE 간격이 겹치는 경우 p <.05에서 값이 어떻게 크게 다를 수 있습니까? 오버랩은 ± 1.96 SE 간격도 오버랩한다고 가정 할 정도로 충분히 큽니다.

2.04 SE 오차 막대를 보여주는 막대 그래프


1
좋은 답변입니다. 95 % 신뢰 구간을 비교하는 것은 (whuber가 이미 지적했듯이) 유의 수준 0.05에서 통계 테스트를 수행하는 것과 같지 않다고 강조하고 싶습니다. 물론 이것을 다루는 논문이 있습니다. 신뢰 구간이 유일하게 사용 가능한 통계 인 경우 Payton 은 가우시안 데이터의 유의 수준 0.05에 85 % 구간을 사용하도록 제안합니다. 그들은 여기서 그들의 작업을 수행 합니다 .
Martin Berglund

1
감사합니다, @Martin. 루프를 닫으려면 Payton 등의 논문을 보지는 않았지만 85 %의 기본은 분명합니다. 제곱 할 때 84 %에 해당하는 z- 값 은 . 이 중 두 개를 추가하면 . 제곱근은 이며 95 % 간격에 해당하는 z 값과 거의 같습니다. Payton이 84 %에서 85 %로 반올림했다고 가정합니다. 다시 말해, 그들의 추천 (그러나 도출 된)은 내가 제공 한 것과 동일한 분석으로 설명 될 수 있습니다. 242
whuber

@MartinBerglund와 whuber는 0.05 수준에서 통계 테스트를 수행하기위한 83.4 %의 신뢰 구간에 대한 독립적 인 계산이 독창적 이었는지 궁금 할 때 답을 얻었습니다. 도움이되는 문서 참조에 감사드립니다.
tristan

답변:


11
  1. 2.04 는 자유도가 31 인 Student t 분포와 함께 사용할 승수입니다. 이 인용문은 자유도가 적절하다고 제안 하며,이 경우 올바른 승수는 입니다.302.0422722.04

  2. 평균은 표준 오차 로 비교됩니다 . 표준 오차는 일반적으로 표준 편차의 곱하기 (아마도 )이 표본 크기입니다. 캡션이 바에게 전화에 올바른 경우 "표준 오차를,"후 표준 편차 이상이어야 약의 값보다 배 과 같이합니다. 표준 편차가 이고 과 사이의 평균이 가까운 대부분의 값을 가져야 하는 양수 값 의 데이터 집합1/nn30+1=31315.56316×5.5=3314180그리고 소수의 큰 가치는 엄청나게 보이지 않습니다. (그렇다면 Student t 통계에 기반한 전체 분석은 어쨌든 유효하지 않을 것입니다.) 우리는 그 수치가 표준 오차가 아니라 표준 편차를 나타낼 가능성이 있다고 결론을 내립니다 .

  3. 평균의 비교는 신뢰 구간의 중복 (또는 그 부족)에 근거하지 않습니다. 두 개의 95 % CI가 겹칠 수 있지만 여전히 큰 차이를 나타낼 수 있습니다. 그 이유는 ( 독립적 ) 평균 차이 의 표준 오차가 평균의 표준 오차의 제곱의 합의 제곱근이기 때문입니다. 예를 들어 평균의 표준 오차가14 같다 1 평균의 표준 오차 17 같다 1그런 다음 첫 번째 평균의 CI ( 2.04)에서 연장 11.9216.08 두 번째의 CI는 14.9219.03겹치는 부분이 많습니다. 그럼에도 불구하고의 SE 차이는 동일합니다12+121.41. 평균의 차이1714=3보다 큼 2.04 이 값을 곱하면 중요합니다.

  4. 이들은 쌍별 비교입니다. 개별 값은 많은 변동성을 보일 수 있지만 그 차이는 매우 일관 될 수 있습니다. 예를 들어(14,14.01), (15,15.01), (16,16.01), (17,17.01)등은 각 구성 요소에 차이가 있지만 차이점은 일관되게 나타납니다. 0.01. 이 차이는 두 구성 요소에 비해 작지만 일관성 은 통계적으로 유의합니다.


많은 감사합니다. 이 기사에서는 사후 테스트가 두 가지 유형의 시험에 대한 각 참가자의 응답을 비교 한 것으로 어느 곳에서나 언급하지 않았으므로 피험자를 대상 간 비교로 취급한다고 결론 내 렸습니다. 덜 적절하고 덜 강력 함). 나는 당신이 옳 아야한다고 생각하며, 그들은 더 민감하고 (그래프하기가 더 어려운) 테스트를하고있었습니다. 포인트 # 3에 관해서는, 나의 유일한 응답은 분명히 몇 가지 통계를 다시 배울 필요가 있다는 것입니다 ...
octern

귀하의 질문에 "계획된 쌍별 비교"라는 문구를 선택했습니다. 그러나 인용 한 나머지 결과는 쌍 비교가 아니라고 제안하지만 내 대답의 3 번 지점과 비슷한 계산에서 나온 것 같습니다.
whuber

내가 의미 한 바는 3 가지 조건을 모두 비교하는 옴니버스 테스트를 수행하는 대신 3 가지 조건 중 2 가지 조건을 서로 직접 비교하는 사후 테스트를 수행하고 있다는 것입니다. 혼란에 대해 죄송합니다. 그러나 이제는 그것을 보았으므로 어쨌든 당신이 맞았다 고 생각합니다. 옴니버스 테스트 통계 ( F(2,60)=5.64, p<.05) 를보고하는 방식 은 반복 측정 테스트이므로 사후 테스트도 마찬가지 일 수 있습니다.
octern

좋은 답변 감사합니다. "(독립적 인) 평균 차이의 표준 오차가 평균의 표준 오차의 제곱의 합의 제곱근이기 때문입니다." 나는 이것을 논의하지만 참조 할 수없는 참조를 찾고 있습니다. 이와 관련하여 몇 가지 지침을 부탁드립니다. 누군가 나를 도울 수 있습니까?
Johannes

@Johannes SE의 제곱은 표본 평균의 분산에 비례합니다. (비율의 상수는 정의에 따라 다르며 샘플 크기에 따라 약간 다를 수 있습니다.) 독립성은 평균 차이의 샘플링 분포의 분산이 SE의 제곱의 합임을 의미합니다.
whuber

3

혼동의 일부는 데이터의 혼란스러운 표현입니다. 반복 측정 설계 인 것처럼 보이지만 오차 막대는 실제 평균값이 얼마나 잘 추정되었는지에 대한 신뢰 구간입니다. 반복 측정의 기본 목적은 원시 평균 값의 품질 추정치를 얻기 위해 충분한 데이터를 수집하지 않도록하는 것입니다. 따라서 제시된 오류 표시 줄과 같은 오류 표시 줄은 실제로 이야기되는 내용과 거의 관련이 없습니다. 중요한 관심의 가치가 효과입니다. 그래프가 스토리의 요점을 강조하기 위해 효과와 그 신뢰 구간을 그래프로 표시하는 것이 더 적절했을 것입니다.


감사합니다! 그래프가 분석을 나타내지 않는 것처럼 보이는 이유를 표현하기 위해 약간의 노력을 기울였습니다.
octern
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.