한 표본 T- 검정에서 평균 차이의 신뢰 구간을 해석하는 방법은 무엇입니까?


21

SPSS는 출력 "차이 수단의 신뢰 구간"을 제공합니다. 나는 "100에서 95 번, 우리의 표본 평균 차이가이 경계 사이에있을 것"이라는 의미를 어떤 곳에서 읽었습니다. "평균 차이의 신뢰 구간"을 설명하기 위해보다 명확한 문구를 제안 할 수 있습니까? 이 출력은 1- 표본 t- 검정과 관련하여 나타납니다.


1
통역은 무엇입니까?
mpiktas

1
이 비율에 대해 특별한 것은 없습니다. 어떤 것의 추정치에 대한 CI도 비슷한 방식으로 해석됩니다. 그러나 추정되는 내용에 따라 다른 절차를 사용하여 CI를 구성 할 수도 있습니다. 따라서이 질문은 CI의 해석을 요구하는 이전 질문과 정확히 동일합니다.
whuber

답변:


13

존경받는 통계 학자조차도 쉬운 일이 아닙니다. Nate Silver의 최근 시도를 살펴보십시오 .

... 통근 통근 시간이 평균보다 10 분 더 오래 걸리는 횟수를 알려달라고 요청한 경우 (일부 버전의 신뢰 구간이 필요한 경우) 약간 생각해야합니다.

( New York Times, 9/29/10 의 FiveThirtyEight 블로그에서) 9 신뢰 구간 이 아닙니다 . 해석 방법에 따라 공차 구간 또는 예측 구간입니다. (그렇지 않으면 실버 씨의 확률 추정에 대한 훌륭한 논의에는 아무런 문제가 없습니다. 잘 읽겠습니다.) 다른 많은 웹 사이트 (특히 투자에 초점을 둔 웹 사이트)는 신뢰 구간을 다른 종류의 구간과 유사하게 혼동합니다.

New York Times는 생산 및보고에 대한 통계 결과의 의미를 명확히하기 위해 노력했습니다. 많은 여론 조사 아래의 글씨에는 다음과 같은 내용이 포함됩니다.

이론적으로 20 개 중 19 개 사례에서 모든 성인의 표본을 기반으로 한 결과는 모든 미국 성인과의 인터뷰를 통해 얻은 결과와 어느 방향에서든 3 % 포인트 차이가 없습니다.

( 예를 들어 , 폴링을 실시했다 방법 , 2011 년 5 월.)

약간 말로 표현할 수도 있지만 명확하고 정확합니다.이 문장 은 설문 조사 결과 의 샘플링 분포 변동성을 특징으로합니다 . 그것은 신뢰 구간이라는 생각에 가까워지고 있지만 아직은 그렇지 않습니다. 그러나 많은 경우에 신뢰 구간 대신 이러한 문구를 사용하는 것을 고려할 수 있습니다.

인터넷에 많은 혼란이 생길 ​​경우 권위있는 출처를 찾는 것이 유용합니다. 내가 가장 좋아하는 것 중 하나는 Freedman, Pisani 및 Purves의 유명한 텍스트, 통계입니다. 현재 제 4 판에서는 30 년 이상 대학에서 사용되어 왔으며 명확하고 명확한 설명과 고전적인 "자주 주의적"방법에 중점을두고 있습니다. 신뢰 구간 해석에 대한 내용을 살펴 보겠습니다.

95 %의 신뢰 수준은 샘플링 절차에 대해 말합니다.

[p. 384; 모든 인용문은 제 3 판 (1998)에서 발췌 한 것이다]. 계속됩니다

표본이 다르게 나오면 신뢰 구간이 달라졌을 것입니다. ... 모든 표본의 약 95 %에 대해 구간은 모집단 백분율을 포함하고 나머지 5 %는 그렇지 않습니다.

[피. 384]. 본문은 신뢰 구간에 대해 훨씬 더 많은 것을 말해 주지만, 이것으로 충분합니다. 그것의 접근은 논의의 초점을 샘플 로 옮기고 , 진술을 엄격하고 명확하게하는 것입니다. 그러므로 우리는 우리 자신의보고에서 같은 것을 시도 할 수 있습니다. 예를 들어, 가설 실험에서보고 된 백분율 차이에 대한 신뢰 구간 [34 %, 40 %]를 설명하는 데이 접근법을 적용 해 보겠습니다.

"이 실험은 무작위로 선택된 피험자 표본과 임의의 대조군 선택을 사용했습니다. 우리는 차이에 대해 34 %에서 40 %의 신뢰 구간을보고합니다. 이것은 실험의 신뢰성을 정량화합니다. 피험자와 대조군의 선택이 다른 경우 이 신뢰 구간은 선택한 주제와 통제에 대한 결과를 반영하기 위해 변경 될 것입니다. 그러한 경우의 95 %에서 신뢰 구간은 ( 모든 주제와 모든 통제 사이의) 실제 차이를 포함 하고 다른 5 %는 그렇지 않습니다 . 확실하지하지만 - - 따라서 그것은 가능성이 높다고 신뢰 구간이 진정한 차이를 포함 : 우리가 진정한 차이는 34 %와 40 % 사이에 생각입니다. "

(이것은 내 텍스트이며 확실히 향상 될 수 있습니다 : 편집자를 초청하십시오.)

이와 같은 긴 진술은 다소 다루기 힘들다. 실제 보고서에서는 대부분의 상황 (무작위 표본 추출, 주제 및 통제, 변동 가능성)이 이미 설정되어 있으므로 위 진술의 절반이 불필요합니다. 보고서에 표본 변동성이 있고 표본 결과에 대한 확률 모델이 표시되는 경우 일반적으로 청중이 필요로하는만큼 신뢰 구간 (또는 다른 임의 구간)을 명확하고 엄격하게 설명하는 것은 어렵지 않습니다.


Whuber에게 감사드립니다. 평균에 대한 신뢰 구간을 잘 알고 있습니다. 내가 혼란스러워하는 평균 (샘플과 팝 사이)의 차이에 대한 CI입니다.
Anne

@Anne 무슨 말을하는거야? 귀하의 질문이나 답변 중 어느 것도 내가 말할 수있는 한 표본 평균과 모집단 평균의 차이를 말하는 것은 아닙니다. 귀하의 질문은 두 표본 평균 간의 차이 (아마도 실험 대상 그룹의 평균과 대조군 그룹의 평균)를 나타내는 것으로 보입니다.
whuber

내가 생각하는 예는 표본 평균과 모집단 평균의 차이를 보는 곳입니다. 이 경우 샘플과 팝 사이의 CI가 정확히 의미하는 것은 무엇입니까? 팝 평균 편차를 추정하기 위해 표본 평균을 사용 했으므로 평균 추정치 주변의 CI를 추정하고 있습니다. 평균의 차이는 우리가 제공 한 팝 평균과 샘플 평균의 차이가 아닙니다. 그래서 무엇입니까?
Anne

1
@Anne "인구 평균"은 샘플링되는 모집단 의 가설적이고 알려지지 않은 평균 입니까, 아니면 철저하게 샘플링 된 다른 인구 의 측정 된 평균입니까? 또한 어떤 의미에서 "표본 평균"을 사용하여 모집단 표준 편차 를 추정 했습니까? 아마도 오타일까요?
whuber

2
@ whuber 감사합니다. "모든 샘플의 95 % (즉, 가능한 모든 복제의 95 %)에 대해 계산 된 CI가 그 진정한 차이를 다룰 것입니다." "100에서 95 배, 샘플 평균 차이가이 경계 사이에있을 것"보다 명확하고 설명이 논리적으로 합리적입니다.
Anne

5

기술적 인 관점에서, 나는 개인적으로 신뢰 구간 해석에 대한 "명확한 표현"이 없다고 생각합니다.

신뢰 구간을 다음과 같이 해석 합니다. 95 % 신뢰 구간이 실제 평균 차이를 포함 할 확률은 95 %입니다.

이것의 해석이다 경우 우리는 전체 실험을 반복했다 번, 동일한 조건에서, 우리는 것 다른 신뢰 구간을. 신뢰 수준은 실제 평균 차이를 포함하는 이러한 구간의 비율입니다.NNN

그런 추론의 논리를 가진 나의 개인적인 퀴즈는 신뢰 구간에 대한이 설명이 우리의 신뢰 구간을 계산할 때 다른 샘플 을 무시하도록 요구한다는 것입니다 . 예를 들어 표본 크기가 100 인 경우 100 "1- 표본"95 % 신뢰 구간을 계산 하시겠습니까?N1

그러나 이것은 모두 철학에 있습니다. 내가 생각하는 설명에는 신뢰 구간이 모호한 것이 가장 좋습니다. 올바르게 사용하면 좋은 결과를 얻을 수 있습니다.


"N 개의 다른 신뢰 구간"이후 새 문장 시작 "이 말을 더 해석 할 수 있습니다 ..."로 잘 흐르지 않습니다. 세 번째 단락을 수정하는 것이 좋습니다.
Theta30

2
세 번째 단락은 두 번째 단락보다 훨씬 좋습니다. 관측 된 데이터의 조건에 따라 신뢰 구간에는 실제 매개 변수 값이 포함되거나 그렇지 않습니다.
추기경

@probabilityislogic :이 답변이 승인되었으므로 두 번째 단락을 수정하십시오. 또한 두 번째 단락부터 마지막 ​​단락까지의 의미를 명확하게 설명해 주시겠습니까? 읽으면서 나는 당신이 어떤 주장을하고 있는지 잘 모르겠습니다.
추기경

실험의 "반복"과 관련하여 신뢰 구간을 해석하면 이러한 반복에서 이전 실험을 무시해야합니다. 내 요점은 : 신뢰 구간의 "반복"에서 이전 실험을 무시한 것이 왜 우리가 관찰하지 않은 데이터 세트에 대해 좋은지, 그러나 우리가 관찰 한 데이터를 위해 데이터를 함께 모아야 하는가? 보유한 데이터로 최대한 많은 CI를 생성하는 것이 (CI 해석에 대해 이해 한 것) 이해가되지 않습니까?
chanceislogic

1
최적의 결정 이론과 대체로 평행 한 전체 이론이 균일하고 가장 정확한 신뢰도 설정에 있습니다. 어쩌면 그것은 당신을 위해 빠진 퍼즐 조각 일 것입니다. (?)
추기경

3

이 질문에 대한 대략적인 대답은 95 % 신뢰 구간을 통해 실제 모수 값이 해당 구간 내에 있다는 것을 95 % 확신 할 수 있다는 것입니다. 그러나 그 거친 대답은 불완전하고 부정확합니다.

불완전 성은 "95 % 확신"이 구체적인 어떤 것을 의미하는지, 그렇지 않다면, 작은 통계 학자조차도 그 구체적인 의미가 보편적으로 합의되지 않을 것이라는 사실에 명확하지 않다는 사실에 있습니다. 신뢰의 의미는 간격을 얻는 데 사용 된 방법과 사용되는 추론 모델에 따라 다릅니다 (아래에서 더 명확 해지기를 바랍니다).

부정확성은 많은 신뢰 구간이 신뢰 구간을 생성 한 특정 실험 사례에 대한 실제 매개 변수 값의 위치에 대해 알려주도록 설계되지 않았기 때문입니다! 그것은 많은 사람들에게 놀라운 것이지만, 1933 년 논문 "통계 가설의 가장 효율적인 검정의 문제에 관한"에서이 인용문에 명확하게 언급 된 네이 먼-피어슨 철학에서 직접 이어진다.

우리는 특정 가설에 관한 한 확률 이론에 근거한 어떤 시험도 그 가설의 진실 또는 허위에 대한 귀중한 증거를 제공 할 수는 없다고 생각합니다.

그러나 우리는 다른 관점에서 테스트의 목적을 볼 수 있습니다. 각각의 개별 가설이 참인지 거짓인지 알지 않고, 우리는 장기적인 경험에서 우리가 너무 자주 잘못되지 않도록 보장하기 위해 행동에 관한 규칙을 찾을 수 있습니다.

따라서 NP 가설 검정의 '반전'에 기초한 구간은 실험에서 얻은 특성에 대한 추론을 허용하지 않으면 서 알려진 장기 오류 특성을 갖는 특성을 해당 검정에서 상속합니다! 내 이해는 이것이 네이 먼이 혐오로 간주 한 귀납적 추론으로부터 보호한다는 것입니다.

Neyman은 자신의 1941 년 Biometrika 논문“신용 논증과 신뢰 구간 이론”에서 '신뢰 구간'이라는 용어와 신뢰 구간 이론의 기원에 대해 분명하게 주장합니다. 어떤 의미에서, 적절한 신뢰 구간은 그의 규칙에 따라 수행되므로 개별 구간의 의미는 해당 방법에 의해 계산 된 구간이 관련 참을 포함 (커버)하는 장기 실행 률로만 표현 될 수 있습니다. 매개 변수 값.

이제 토론을 분기해야합니다. 한 가닥은 '커버리지'라는 개념을 따르고 다른 가닥은 신뢰 구간과 같은 비나이 마니아 간격을 따릅니다. 이 게시물이 너무 길어지기 전에이 게시물을 완성 할 수 있도록 전자를 연기하겠습니다.

비네이 마니아 신뢰 구간이라고 할 수있는 구간을 생성하는 방법에는 여러 가지가 있습니다. 첫 번째는 Fisher의 기준 간격입니다. ( 'fiducial'이라는 단어는 많은 사람들을 두려워하고 다른 사람들로부터 유쾌한 비방을 유발할 수 있지만, 제쳐두고 떠나겠습니다 ...) 일부 유형의 데이터 (예 : 인구 변동이 알려지지 않은 정상)의 경우 Fisher의 방법으로 계산 된 간격은 숫자와 동일합니다. Neyman의 방법으로 계산되는 간격. 그러나 그들은 정반대되는 해석을 초대합니다. Neymanian 간격은 방법의 장기 적용 범위 속성 만 반영하지만 Fisher의 간격은 수행 된 특정 실험에 대한 실제 매개 변수 값에 관한 유도 추론을 지원하기위한 것입니다.

하나의 구간 경계 세트가 두 개의 철학적으로 구별되는 패러다임 중 하나를 기반으로하는 방법에서 나올 수 있다는 사실은 실제로 혼란스러운 상황을 초래합니다. 결과는 두 가지 상반되는 방식으로 해석 될 수 있습니다. 기준 논점에서 특정 95 % 기준 간격이 실제 매개 변수 값을 포함 할 가능성은 95 %입니다. Neyman의 방법에서 우리는 그 방식으로 계산 된 구간의 95 %가 실제 매개 변수 값을 포함한다는 사실 만 알고 있으며, 실제 매개 변수 값을 포함하는 구간의 확률은 알려지지 않았지만 1 또는 0 일 것입니다.

Neyman의 접근 방식은 대부분 Fisher의 접근 방식에 영향을 미쳤습니다. 내 의견으로는 간격이 자연스럽게 해석되지 않기 때문에 가장 불행합니다. (Nyman과 Pearson의 위 인용문을 다시 읽고 실험 결과에 대한 자연스런 해석과 일치하는지 확인하십시오.

전역 오류 비율과 지역 추론 측면에서 올바르게 간격을 해석 할 수 있다면 간격 사용자가보다 자연스러운 해석을 사용하지 않아도 좋은 이유는 없습니다. 따라서 신뢰 구간에 대한 올바른 해석은 다음 중 하나라는 것이 좋습니다.

  • Neymanian :이 95 % 구간은 장기적으로 (통계 경험상) 95 %의 실제 매개 변수 값을 포함하는 구간을 생성하는 방법으로 구성되었습니다.

  • Fisherian :이 95 % 구간은 실제 매개 변수 값을 포함 할 확률이 95 %입니다.

(베이지안과 우도 방법은 또한 바람직한 빈번한 특성을 갖는 구간을 생성 할 것이다. 이러한 구간은 아마도 네이 만보다 자연스럽게 느껴질 약간 다른 해석을 불러 일으킨다.)


@Micheal-차이가 나는 곳은 미래 간격이 충분한 통계량과 모든 보조 수량에 대한 조건을 기반으로해야한다는 것입니다. Neymans 신뢰 구간에는이 속성이 필요하지 않으므로 특정 하위 클래스 샘플에 대해 다양한 적용 범위를 갖는 "95 % 신뢰 구간"이 적용됩니다.
chanceislogic

@probability-확장 할 수 있습니까? 95 % Neymanian 신뢰 구간이 신뢰 구간이지만 95 % 구간이 아닌 상황이 있다는 것을 의미합니까? 그러한 상황은 무엇입니까? 그러한 상황에서 어부의 간격이 같은 경계를 가지겠습니까?
Michael Lew

표본에서 "95 %"신뢰 구간에 실제 값이 포함되어 있지 않은 경우를 알 수 있습니다. Jaynes의 논문에서 예제 5와 예제 6 은 CI에서 충분한 통계를 사용하지 않으면 장기 적용 범위를 제공하지만 적용 범위는 특정 클래스의 샘플에 따라 달라지는 두 가지 경우를 제공합니다. 이 같은 평균 (장기 보험)하지만 서로 다른 분산 (특정 경우에 적용)과 두 개의 변수를 갖는 유사하다
probabilityislogic

2

신뢰 구간의 의미는 다음과 같습니다. 동일한 방식으로 실험을 반복해야하는 경우 (예 : 동일한 수의 관측치, 동일한 모집단의 그림 등) 가정이 정확하고 계산하는 경우 각 반복에서 해당 구간을 다시 반복하면이 신뢰 구간에는 반복의 95 % (평균)의 실제 유병률이 포함됩니다.

따라서 현재 유병률이 포함 된 구간을 구성했다고 95 % 확실하다고 가정 할 수 있습니다 (가정이 올바른 경우 등).

이것은 일반적으로 다음과 같이 언급됩니다 : 95 % 신뢰를 가지고 임신 기간 동안 흡연 한 어머니 자녀의 4.5 ~ 8.3 %가 비만이됩니다.

이것은 일반적으로 그다지 흥미롭지 않습니다. 담배를 피우지 않은 어머니의 아이들의 유병률 (비율, 상대 위험 등)을 비교하고 싶을 것입니다


(두 개의 스레드를 합병 한 후 여기에 도착한이 회신은 비율의 CI로 구성된 중복 질문에 응답합니다.)
whuber

0

실제 평균 차이가이 구간을 벗어나는 경우 실험의 평균 차이가 실제 평균 차이와 너무 멀어 질 확률은 5 %에 ​​불과합니다.


"이 멀리"는 무슨 뜻입니까? 이것이 멀리 떨어져 있거나 관측 된 평균의 CI 상한입니까?
chanceislogic

실제 평균과 관측 된 평균 사이의 거리는 "이 멀리"라는 의미입니다. 나는 그것을 "지금까지"바꾸겠다. 나는 그것이 좀 더 분명하다고 생각합니다.
Thomas Levine

-2

내 해석 : N 번 실험을 수행하면 (N이 무한대 인 경향이 있음) 실험의 95 %가 95 % 한계 내에있는 신뢰 구간을 갖게됩니다. 더 명확하게 말하면, 그 한계가 "a"와 "b"라고 말하면 표본 평균 차이가 "a"와 "b"의 100 배의 100 배 중 95 배가됩니다. 전체 인구 중.


@ 아유 쉬. 감사. 도움이됩니다. 마지막 문장을 따르지 않아서 죄송합니다.
Anne

@anne-좋아. 내 말은 두 샘플 사이의 평균을 테스트하고 각 샘플에 1000 명의 사람이 있다고 말하면 무한 샘플을 정의 할 수 있습니다 (각각 40 명이라고 함). 서로 다른 실험은 서로 다릅니다. 우리가 신뢰 구간을 관찰하는 실험.
ayush biyani 2016 년

2
@ayush-이것은 두 번째 마지막 문장의 올바른 해석이 아닙니다. 또는 적어도 "a"와 "b"에 아래 첨자를 추가해야합니다. 이렇게하면 이러한 양이 100 회에 걸쳐 변한다는 것이 분명해집니다. 현재 표기법은 "a"와 "b"가 고정 된 양인 것처럼 보입니다.
chanceislogic

@probabilityislogic-동의합니다. 아래 첨자가 필요합니다.
ayush biyani 2016 년

1
[a,b]

-2

"100에서 95 배, 값은 평균의 표준 편차 내에 속합니다."


4
@beginnerstat 사이트에 오신 것을 환영합니다. " 평균의 두 가지 표준 편차 "라고 말하려고했는지 궁금합니다 . 또한 OP가 다른 곳에서 읽은 내용 에서이 문구가 어떻게 향상되는지 알 수 없습니다. 조금 더 자세히 설명 하시겠습니까?
gung-복직 모니카

1
@ gung의 의견에 대한 예 : 특히 "평균"과 "SD"가 사용되는 의미를 이해하는 데 관심이 있습니다. 이것들은 기본 모수 또는 표본 추정치를 의미 합니까? 그것들은 근본적인 랜덤 변수의 분포 또는 iid의 평균의 샘플링 분포 가 그러한 분포에서 변하는 것을 의미합니까?
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.