답변:
앨런 튜링은 로널드 피셔에서 태어 났기 때문입니다.
예전에는 컴퓨터 이전에이 모든 것들을 수작업으로해야했습니다. 평균을 비교하는 테스트는 이런 방식으로 수행 할 수 있습니다. 힘들지만 가능합니다. 분위수 (예 : 중앙값)에 대한 테스트는이 방법으로 수행하는 것이 거의 불가능합니다.
예를 들어, Quantile regression은 상대적으로 복잡한 함수를 최소화하는 데 의존하지만 수작업으로는 불가능합니다. 프로그래밍으로 가능합니다. Koenker 또는 Wikipedia 참조 .
Quantile 회귀 분석은 OLS 회귀 분석보다 가정이 적으며 더 많은 정보를 제공합니다.
Harrell and Flom의 정확한 이유에 세 번째 이유를 추가하고 싶습니다. 그 이유는 맨해튼 거리 (또는 L1)가 아닌 유클리드 거리 (또는 L2)를 표준 근접성 또는 오차 측정 기준으로 사용하기 때문입니다. 하나의 데이터 포인트 있고 그것을 추정 하기 위해 단일 숫자 θ 를 원한다면, 명백한 개념은 그 숫자가 선택된 숫자와 가장 작은 차이를 생성하는 '오류'를 최소화하는 숫자를 찾는 것입니다 데이터를 구성하는 숫자 수학적 표기법에서, 주어진 에러 함수 E에 대해, m i n θ ∈ R ( E ( θ , . 하나는 E (X, Y)이 L2 놈 또는 거리 걸리는 경우 E ( X , Y ) = ( X - Y ) (2) 모든 통해 마이저 θ ∈ R은 평균이다. 만약 L1 또는 맨해튼 거리를 취하면 은 중앙값입니다. 따라서 L2 거리를 사용하는 경우 평균은 자연스러운 수학적 선택입니다!
평균은 평균보다 더 대표적이거나 강력하거나 의미있는 것이 아니라 사람들이 견적자를 estimand와 혼동하기 때문에 평균보다 선택됩니다. 달리 말하면 일부는 정규 분포에서 표본 평균이 표본 중앙값보다 더 정확 하기 때문에 모집단 평균을 관심 수량으로 선택합니다 . 대신, 그들은 당신이 한 것처럼 진정한 관심의 양에 대해 더 많이 생각해야합니다.
한 가지 사이드 바 : 모집단 중앙값에 대해 비모수 적 신뢰 구간이 있지만 모집단 평균에 대한 신뢰 구간을 얻는 비모수 적 방법 (수적으로 집중적 인 경험적 우도 방법 이외의 방법)은 없습니다. 분포가없는 상태를 유지하려면 중앙값에 집중할 수 있습니다.
중앙 제한 정리는이 사이트의 다른 곳에서 논의 된 것처럼 보이는 것보다 훨씬 덜 유용합니다. 분산이 알려져 있거나 분포가 대칭 적이며 샘플 분산이 분산의 경쟁 추정 기인 모양을 갖는 것으로 효과적으로 가정합니다.