평균 평균의 신뢰 구간을 계산하는 방법은 무엇입니까?


19

실험을 세 번 반복한다고 상상해보십시오. 각 실험에서 3 회 측정 값을 수집합니다. 3 가지 실험 방법의 차이점에 비해 3 중 실험은 서로 밀접하게 연관되어 있습니다. 대 평균을 계산하는 것은 매우 쉽습니다. 그러나 어떻게 평균의 신뢰 구간을 계산할 수 있습니까?

샘플 데이터 :

실험 1:34, 41, 39

실험 2:45, 51, 52

실험 3:29, 31, 35

각 실험의 평균값과 마찬가지로 실험 내의 반복 값이 가우스 분포를 따른다고 가정합니다. 실험 내 변동의 SD는 실험 수단 중 SD보다 작습니다. 또한 각 실험에서 세 가지 값의 순서가 없다고 가정하십시오. 각 행에서 세 값의 왼쪽에서 오른쪽 순서는 전적으로 임의입니다.

간단한 접근법은 먼저 각 실험의 평균 인 38.0, 49.3 및 31.7을 계산 한 다음이 세 값의 평균과 95 % 신뢰 구간을 계산하는 것입니다. 이 방법을 사용하면 총 평균은 39.7이며 95 % 신뢰 구간은 17.4에서 61.9입니다.

이 접근법의 문제점은 3 중의 변형을 완전히 무시한다는 것입니다. 그 변형을 설명하는 좋은 방법이 없는지 궁금합니다.


1
답이 아니라 직관적 인 관찰입니다. 풀링 된 데이터 평균 (총 9 개의 obs) 에 대한 CI 는 이며 평균을 기반으로하는 CI는 입니다. CI가 무엇을하고 있는지 잘 모르는 경우 (오타 17은 27이 아닌 51, 61은 61이 아님) 3 개의 표준 표준에 대해 , 2 df의 Quantile T dist로 을 얻습니다 . 나는 당신이 찾고있는 CI가 부분 풀링을 가지고 있기 때문에이 둘 사이 어딘가에 있다고 생각합니다. 또한, 분산 식의 측면에서 생각할 수있는 식 중, 각 CI 사용하는 반(39.7±2.13)(39.7±12.83)2.984.300.975V(Y)=E[V(Y|Yg)]+V[E(Y|Yg)]
probabilityislogic

2
@probabilityislogic : 세 가지 실험 방법의 SEM은 5.168 (작성한 2.98 아님)이며 원래 게시물 (17.4 ~ 61.9)에서 제공 한 신뢰 구간이 정확합니다. SEM은 n의 제곱근 (제곱근 3)으로 나누어 SD (8.95)로부터 계산됩니다. 대신 n (3)으로 나눕니다.
Harvey Motulsky

내 실수 는 풀링 된 간격으로 을 으로 대체해야 합니다 (동일한 실수)6.402.136.40
확률

다음 링크가 이것에 답합니까? talkstats.com/showthread.php/11554-mean-of-means

@TST, 풀링 된 분산 에서 Wikipedia에 대한 링크 만있는 것 같습니다 . 정교하게 관리?
chl

답변:


6

균형 랜덤 랜덤 일원 분산 분석 모형 ( y i jμ i ) iid N ( μ i , σ 2 w ) 에서 대 평균에 대한 정확한 정확한 신뢰 구간이 있습니다. 실제로, 검사가 용이하다는 관찰 수단의 분포 ˉ Y 내가 이다 ˉ Y 내가 ~ IID N ( μ를 , τ 2 ) τ 2 = σ 2 B + σ 2 w

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.
y¯iy¯iiidN(μ,τ2) , 그리고 잘 제곱의 합 사이의 것이 알려져SS의B는분포 가지고SS의B~Jτ2χ 2 I - 1 전반적인 관찰 평균 무관 ˉ Y~N(μ,τ2τ2=σ2+σ2제이에스에스
에스에스제이τ2χ나는12
. 따라서 ˉ yμ
와이¯(μ,τ2나는)
I-1자유도를갖는 Studentt분포를가지며, 여기서μ에 대한 정확한 신뢰 구간을 얻는 것이 쉽습니다.
와이¯μ1나는에스에스제이(나는1)
나는1μ

이 신뢰 구간은 관측 값으로 그룹 평균 을 고려하여 가우스 평균에 대한 고전적인 구간에 지나지 않습니다와이¯나는 . 따라서 간단한 접근 방식은 다음과 같습니다.

간단한 접근법은 먼저 각 실험의 평균 인 38.0, 49.3 및 31.7을 계산 한 다음이 세 값의 평균과 95 % 신뢰 구간을 계산하는 것입니다. 이 방법을 사용하면 총 평균은 39.7이며 95 % 신뢰 구간은 17.4에서 61.9입니다.

맞습니다. 무시 된 변형에 대한 직감 :

이 접근법의 문제점은 3 중의 변형을 완전히 무시한다는 것입니다. 그 변형을 설명하는 좋은 방법이 없는지 궁금합니다.

잘못되었습니다. 또한 /stats//a/72578/8402 에서 이러한 단순화의 정확성에 대해 언급했습니다.

2014 년 12 월 4 일 업데이트

일부 세부 사항은 이제 내 블로그에 작성되었습니다 . 신뢰 구간을 얻기 위해 모델 축소 .


이 솔루션을 파이썬으로 구현하는 데 도움이 필요하십니까? stackoverflow.com/questions/45682437/…
blehman

7

이것은 선형 혼합 효과 모델 내 추정 문제입니다. 문제는 대 평균 의 분산이 (데이터의 분산 분석을 통해) 별도로 추정되어야하는 두 개의 분산 성분 의 가중 합이라는 것입니다 . 추정치는 다른 자유도를 갖습니다. 따라서 일반적인 소 표본 (학생 t) 공식을 사용하여 평균에 대한 신뢰 구간을 구성하려고 시도 할 수 있지만 평균과의 편차가 학생 t 분포를 정확하게 따르지 않기 때문에 공칭 범위를 달성 할 수는 없습니다.

Eva Jarosova 의 선형 혼합 효과 모델을 사용한 추정 (2010) 기사 에서이 문제에 대해 설명합니다. (2015 년 현재 더 이상 웹에서 사용할 수없는 것으로 보입니다.) "작은"데이터 집합 (이것보다 이보다 약 3 배 더 큰)의 컨텍스트에서 시뮬레이션을 사용하여 두 개의 대략적인 CI 계산을 평가합니다 (우물 알려진 Satterthwaite 근사와 "Kenward-Roger 's method"). 그녀의 결론은 다음과 같습니다.

시뮬레이션 연구에 따르면 공분산 모수의 추정 품질과 결과적으로 작은 표본의 신뢰 구간 조정이 상당히 나빠질 수 있음이 밝혀졌습니다 .... 잘못된 평가는 기존 구간의 실제 신뢰 수준에 영향을 줄뿐만 아니라 조정을 불가능하게 할 수도 있습니다. 균형 데이터의 경우에도 세 가지 유형의 간격 [기존, Satterthwaite, KR]은 실질적으로 다를 수 있습니다. 기존의 간격과 조정 된 간격의 현저한 차이가 관찰되면 공분산 모수 추정값의 표준 오차를 확인해야합니다. 한편, 3 종류의 간격의 차이가 작은 경우에는 조정이 불필요 해 보인다.

요컨대, 좋은 접근 방식은

  1. 분산 성분 추정값을 사용하고 t- 분포를 적용하여 기존 CI를 계산합니다.

  2. 또한 조정 된 CI 중 하나 이상을 계산하십시오.

  3. 계산이 "가까운"경우 기존 CI를 수락하십시오. 그렇지 않으면 신뢰할 수있는 CI를 생성하기에 데이터가 충분하지 않다고보고하십시오.


분산 성분을 사용하면 원래 게시물에서 계산 한 것과 동일한 신뢰 구간이 생성됩니다. 분산 분석표의 열 간 간격은 480.7이고 2 df이며, MS는 240.3입니다. SD는 sqrt (MSbetween / n) = sqrt (240.3 / 3) = 8.95이며, 원래 게시 한 동일한 CI (17.4 ~ 61.9)로 이어집니다. 나는 당신이 인용 한 Jarasova 논문을 따르는 것이 매우 어렵다는 것을 알았으며, 그것이 그것이 여기에 관련되어 있는지 완전히 확신하지는 못합니다 (반복 된 측정 디자인에 관한 것 같습니다). ???
Harvey Motulsky 2018 년

@Harvey 당신의 설명은 저에게 반복되는 측정 값처럼 들립니다! 나는 Jarasova 논문이 제자리에 있다고 믿는다.
whuber

1
나는 3 중이 3 개의 다른 시험 통 (또는 우물) 인 실험실에서 일반적인 상황을 생각하고 있습니다. 표에 제시된 세 가지 순서는 임의적입니다. 첫 번째 실험에서 반복 # 2와 두 번째 또는 세 번째 실험에서 반복 # 2 간에는 연결 또는 상관 관계가 없습니다. 각 실험에는 세 가지 측정이 있습니다. 따라서 실제로 반복되는 조치는 아닙니다. 권리?
Harvey Motulsky 2016 년

whuber, 여기 정확한 학생 분포가 있습니다. 내 대답을 참조하십시오.
Stéphane Laurent

@whuber Eva Jarasova의 기사에 제공 한 링크가 종료되었으며 Google 검색에서 아무런 결과도 얻지 못했습니다. 참조를 수정할 수 있습니까?
Placidia

0

두 문제를 모두 해결하는 하나의 신뢰 구간을 가질 수 없습니다. 하나를 선택해야합니다. 실험 분산 내 평균 제곱 오차 항에서 하나를 도출하여 실험 내 값을 얼마나 정확하게 추정 할 수 있는지 또는 실험간에 값을 계산할 수 있는지에 대해 무언가를 말할 수 있습니다. 방금 전자를 한 경우 실제 평균 값에 대해 아무것도 나타내지 않고 효과 (이 경우 0)에 대해서만 아무것도 나타내지 않기 때문에 대 평균이 아닌 약 0 주위에 플롯하는 경향이 있습니다. 또는 둘 다 플롯하고 그들이하는 일을 설명 할 수 있습니다.

당신은 그 사이에 손잡이가 있습니다. 내부에서 MSE와 함께 작동하기 위해 분산 분석에서 오류 항을 계산하는 것과 같습니다. CI의 SE는 sqrt (MSE / n)입니다 (이 경우 n = 3).


실제로 각 평균과 총 평균에 대해 신뢰할 수있는 간격을 가질 수 있습니다. 베이지안 다단계 모델 만 사용하십시오. 때때로 이러한 종류의 추정을 부분 풀링이라고합니다. 문제는 작은 샘플이라고 생각합니다.
Manoel Galdino

각 평균에 대한 신뢰 구간과 총 평균에 대한 신뢰 구간을 가질 수 있지만 신뢰할 수있는 구간과 마찬가지로 다른 것입니다. 나는 연구 내 차이와 집단 간 차이와 관련하여 CI에 관한 질문으로 해석했다. 그것은 여전히 ​​다른 CI의 의미가 다른 것을 남깁니다. (나는 또한 문자 그대로 n을하지 않았다)
John

1
또한 내가 할 수없는 방식은 실제로 "할 수없는"것은 아닙니다. 어떻게 든 모든 것에 대한 하나의 신뢰 구간을 계산하는 단일 방정식을 생각해 낼 수 있습니다. 현명한 것을 의미하지는 않습니다. 그것이 내가 할 수 없었던 것입니다.
John

내 의견을 쓴 후 몇 분 후에 나는 우리가 문자 그대로 n을 취해서는 안된다는 것을 깨달았습니다. 그러나 그것을 편집하는 것은 늦었습니다 =).
Manoel Galdino

0

원래의 데이터 범위에서도 대 평균의 CI가 너무 넓다고 생각합니다 [17,62].

이 실험은 화학에서 매우 일반적입니다. 예를 들어, 참고 자료 인증시 전체 로트에서 일부 병을 무작위로 선택해야하며 각 병에 대해 반복 분석을 수행해야합니다. 기준값과 불확실성을 어떻게 계산합니까? 그것을 할 수있는 방법이 많이 있지만 가장 현명한 (그리고 올바른 생각은) 메타 분석 또는 ML (Dersimonian-Laird, Vangel-Rukhin 등)을 적용하는 것입니다.

부트 스트랩 견적은 어떻습니까?


1
시뮬레이션 (정상 분포 된 주 효과 및 오차를 사용한 10,000 회 시행)은 [21, 58]이 평균에 대한 대칭 양면 95 % CI임을 나타냅니다.
whuber

whuber : 시뮬레이션을 어떻게했는지 궁금합니다. 원본 데이터에서 부트 스트랩? 아니면 실제로 시뮬레이션? 후자의 경우 데이터를 시뮬레이션하기 위해 어떤 평균 및 SD 값을 사용 했습니까?
Harvey Motulsky
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.