기본 가설 검정이 평균이 아닌 평균에 중점을 둔 이유는 무엇입니까?


32

기초 저학년 통계 과정에서 학생들은 (일반적으로?) 모집단의 평균에 대한 가설 테스트를받습니다.
초점이 중간이 아닌 평균에있는 이유는 무엇입니까? 내 생각에 중심 제한 정리로 인해 평균을 테스트하는 것이 더 쉽지만 교육받은 설명을 읽고 싶습니다.


3
평균에는 고유성, 계산 및 미적분에 유용한 속성이 있습니다. 종종 충분한 통계와 관련이 있습니다.
Henry

답변:


40

앨런 튜링은 로널드 피셔에서 태어 났기 때문입니다.

예전에는 컴퓨터 이전에이 모든 것들을 수작업으로해야했습니다. 평균을 비교하는 테스트는 이런 방식으로 수행 할 수 있습니다. 힘들지만 가능합니다. 분위수 (예 : 중앙값)에 대한 테스트는이 방법으로 수행하는 것이 거의 불가능합니다.

예를 들어, Quantile regression은 상대적으로 복잡한 함수를 최소화하는 데 의존하지만 수작업으로는 불가능합니다. 프로그래밍으로 가능합니다. Koenker 또는 Wikipedia 참조 .

Quantile 회귀 분석은 OLS 회귀 분석보다 가정이 적으며 더 많은 정보를 제공합니다.


6
당시 컴퓨터 는 존재했지만 지금 우리가 의미하는 것과는 매우 다른 것을 의미했습니다.
Maarten Buis

6
과연! 컴퓨터는 계산을 수행 한 사람들이었습니다.
Peter Flom-Monica Monica 복원

2
@nafrtiti 강의 계획서가 바뀌고 있지만 천천히. 극복해야 할 모멘텀이 많으며 통계 외부의 사람들은 새로운 아이디어에 익숙하지 않으므로 거부 할 수 있습니다.
Peter Flom-Monica Monica 복원

3
@SunQingyao 정렬은 추가하는 것보다 훨씬 비쌉니다. 추가는 O (n)이며 하드웨어의 가장 기본적인 작업 중 하나이며 하나의 레지스터 만 필요합니다. 그 외에도, 더 많은 데이터를 수집하고 새로운 평균을 계산할 수있는 항목의 수와 총 개수 만 알면됩니다. 중앙값을 계산하려면 전체 세트가 필요합니다
JimmyJames

3
빠른 선택 (및 불량 피벗이 무작위로 선택된 경우 중간 값을 사용하여 피벗을 선택)을 사용하면 O (N)에서 Quantile을 찾을 수 있으므로 중간 값과 평균 간의 간격이 더 작습니다. 물론 그러한 방법이 존재한다는 것을 알아야합니다 (Turings 시간에도 알려지지 않았습니다).
슈 르트

22

Harrell and Flom의 정확한 이유에 세 번째 이유를 추가하고 싶습니다. 그 이유는 맨해튼 거리 (또는 L1)가 아닌 유클리드 거리 (또는 L2)를 표준 근접성 또는 오차 측정 기준으로 사용하기 때문입니다. 하나의 데이터 포인트 있고 그것을 추정 하기 위해 단일 숫자 θ 를 원한다면, 명백한 개념은 그 숫자가 선택된 숫자와 가장 작은 차이를 생성하는 '오류'를 최소화하는 숫자를 찾는 것입니다 데이터를 구성하는 숫자 수학적 표기법에서, 주어진 에러 함수 E에 대해, m i n θ R ( E ( θ ,엑스1,엑스θ . 하나는 E (X, Y)이 L2 놈 또는 거리 걸리는 경우 E ( X , Y ) = ( X - Y ) (2) 모든 통해 마이저 θ R은 평균이다. 만약 L1 또는 맨해튼 거리를 취하면minθR(E(θ,엑스1,엑스)=나는θ아르 자형(나는=1나는=이자형(θ,엑스나는))이자형(엑스,와이)=(엑스와이)2θ아르 자형 은 중앙값입니다. 따라서 L2 거리를 사용하는 경우 평균은 자연스러운 수학적 선택입니다!θ아르 자형


6
이후 광범위하게 나타 내기 위해 사용되는 기대 , 나는 대체 제안 E를 , 말과 ERR . 이자형이자형오류
Richard Hardy

3
아마도 그것은 것을 주목할 가치가있다 의 미분이다 X = 0 동안 | x | 아니다. 제 생각에는 이것이 MAE가 MAE보다 수학적 통계 분야에서 더 널리 퍼져있는 미묘하지만 중요한 근본적인 이유입니다. 엑스2엑스=0|엑스|
Just_to_Answer 21

1
@Just_to_Answer-또 다른 이유라고 생각합니다. 나는 수년에 걸쳐 이것에 대해 많이 생각했습니다. 나를 위해, 나는 당신이 말하는 것이 우리가 왜 맨해튼 거리가 아닌 유클리드를 일반적으로 사용하는 이유와 관련이 있다고 결론을 내 렸습니다 :)
aginensky

19

평균은 평균보다 더 대표적이거나 강력하거나 의미있는 것이 아니라 사람들이 견적자를 estimand와 혼동하기 때문에 평균보다 선택됩니다. 달리 말하면 일부는 정규 분포에서 표본 평균이 표본 중앙값보다 더 정확 하기 때문에 모집단 평균을 관심 수량으로 선택합니다 . 대신, 그들은 당신이 한 것처럼 진정한 관심의 양에 대해 더 많이 생각해야합니다.

한 가지 사이드 바 : 모집단 중앙값에 대해 비모수 적 신뢰 구간이 있지만 모집단 평균에 대한 신뢰 구간을 얻는 비모수 적 방법 (수적으로 집중적 인 경험적 우도 방법 이외의 방법)은 없습니다. 분포가없는 상태를 유지하려면 중앙값에 집중할 수 있습니다.

중앙 제한 정리는이 사이트의 다른 곳에서 논의 된 것처럼 보이는 것보다 훨씬 덜 유용합니다. 분산이 알려져 있거나 분포가 대칭 적이며 샘플 분산이 분산의 경쟁 추정 기인 모양을 갖는 것으로 효과적으로 가정합니다.


2
나는 순열 테스트를 통해 평균에 대해 비모수 적 신뢰 구간을 구성하는 것이 가능하다고 생각합니다 (예를 들어 특정 기능 형태를 가정하지 않고 대칭 가정하에 수행 할 수 있음). 대칭이 아닌 다른 가정에서도 가능하지만 다소 제한적인 상황입니다. 부트 스트랩과 함께 제공되는 대략적인 적용 범위를 처리 할 준비가되면 대칭과 같은 가정없이 비모수 간격을 얻을 수 있습니다.
Glen_b-복지 주 모니카

2
대칭이라고 가정하면 파라 메트릭입니다. 이것이 비대칭 사례로 확장 된 것을 보지 못했습니다. 부트 스트랩 (학생이 아닌 t 방법을 제외한 모든 변형)은 심각한 비대칭에서 매우 부정확합니다. stats.stackexchange.com/questions/186957
Frank Harrell

5
대칭 은 유한 매개 변수가 아닙니다. Wilcoxon 부호있는 순위 테스트는 널 (null) 아래에서 대칭 (기호의 교환 성을 갖기 위해)을 가정합니다. 당신은 그 파라 메트릭이라고 부를 것입니까?
Glen_b-복지 모니카


2
대칭에 관한 @Glen_b 질문에서-그것은 훌륭한 질문입니다. Wilcoxon 부호가있는 검정은 WIlcoxon 2- 표본 검정과 달리 대칭성이 매우 높기 때문에 흥미로운 사례입니다. 대칭과 같은 일반적인 가정이 필요하지만 비모수 적이라고 말할 수 있다고 생각합니다. 어쩌면 용어가 "제한이있는 비모수 적"이어야합니까? 반면 비모수 2- 표본 검정에는 유형 II 오류를 최적화하는 방법 (유형 I 오류가 아닌)에 대한 제한이 있습니다.
Frank Harrell
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.