평균, 중앙값 및 모드 간의 경험적 관계


40

약간 왜곡 된 단항 분포의 경우 평균, 중간 및 모드 사이에 다음과 같은 경험적 관계가 있습니다. 이 관계는 어떻습니까 유래?

(Mean - Mode)3(Mean - Median)

Karl Pearson은이 결론을 내리기 전에 수천 가지의 관계를 구성 했습니까? 아니면이 관계의 논리적 인 추론이 있습니까?

답변:


29

나타내고 평균 ( 평균) 중앙값, 표준 편차 모드. 마지막으로, 표본으로 하여 처음 두 모멘트가 존재 하는 연속 단봉 분포 를 실현 합니다.μmσMXF

잘 알려져 있습니다

(1)|μm|σ

이것은 빈번한 교과서 연습입니다.

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
첫 번째 평균의 정의와 평등의 도출이, 세 번째는 중앙값 (모두들 고유 minimiser 때문에에 대해 오는 의의)Jensen의 불평등에서 4 번째 (즉, 볼록 함수의 정의). 실제로,이 불평등은 더 엄격해질 수 있습니다. 실제로, 위의 조건을 만족하는 대해 다음과 같이 나타낼 수있다.cE|Xc|F

(2)|mμ|0.6σ

그것은 일반적하지 참 (에 비록 Abadir 2005 어떤 단봉 분포 중 어느 하나를 만족해야 함) 그것은 여전히 것으로 도시 될 수있다 불평등

Mmμ or Mmμ

(3)|μM|3σ

(비뚤어 짐에 관계없이) 모든 단 변형의 적분 분포를 유지합니다. Johnson과 Rogers (1951) 에서 공식적으로 증명 되었음에도 불구하고 증거는 여기에 맞지 않는 많은 보조 정리에 의존합니다. 원래 종이를 보러 가십시오.


분포 가 을 만족시키기에 충분한 조건 이 [2]에 주어진다. 경우 :FμmMF

(4)F(mx)+F(m+x)1 for all x

그런 다음 입니다. 또한 인 경우 불평등은 엄격합니다. Pearson Type I에서 XII 로의 분포는 [4]를 만족하는 분포 군의 한 예입니다 (예를 들어, Weibull은 가 보유하지 않은 공통 분포입니다 [5] 참조)).μmMμm(4)(4)

이제 가정 엄격하게 보유하고있다 wlog 그 , 우리가 그 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

이 두 범위 중 두 번째 범위가 비어 있지 않기 때문에 어설 션이 참인 분포를 찾을 수 있습니다 (예 : ) 분포 모수의 일부 값 범위에 대해서는 모든 분포에 해당되지 않으며 만족하는 모든 분포에도 해당되지 않습니다 .0<mμ<33<σ=1(4)

  • [0] : 모달 분포에 대한 모멘트 문제. NL Johnson과 CA Rogers. 수학 통계 연보, Vol. 22, No. 3 (1951 년 9 월), pp. 433-439
  • [1] : 평균-중간 모드 불평등 : 대응 사례 Karim M. Abadir Econometric Theory, Vol. 21, No. 2 (2005 년 4 월), pp. 477-482
  • [2] : WR van Zwet, 평균, 중앙값, 모드 II, 통계 학자. Neerlandica, 33 (1979), 1-5 페이지.
  • [3] : 단일 분포의 평균, 중앙값 및 모드 : 특성. S. Basu와 A. DasGupta (1997). 이론 프로 밥. Appl., 41 (2), 210–223.
  • [4] : 평균, 중앙값, 모드 및 왜도에 대한 일부 설명입니다. 미치 카즈 사토. 호주 통계 저널. 39 권 2 호, 219–224면, 1997 년 6 월
  • [5] : PT von Hippel (2005). 평균, 중앙값 및 기울이기 : 교과서 규칙 수정. 통계 학술지 13 권 2 호

미안합니다. 저는 1 학년 수 학생입니다. 관계가 어떻게 도출되었는지 설명하는 링크 / 책 / 종이를 제공 / 권장 할 수 있습니까?
Sara

3
@Sara 나는 그것이 "Pearson mode skewness"에이 경험적 관계를 사용하는 Karl Pearson으로 거슬러 올라간다고 생각합니다. 이 외에도, 당신은이 온라인 기사 j.mp/aWymCv를 흥미롭게 찾을 수 있습니다 .
chl

당신이 제공 한 링크와 답변에 대해 chl와 kwak에게 감사합니다. 공부하겠습니다.
사라

2
다양한 포인트 : 가 의 중앙값 일 때 최소화됩니다 . Von Hippel의 기사 (chl에 의해 링크 됨) 는 예외를 논의 하고 btinternet.com/~se16/hgb/median.htm 은 연속 분포와 불연속 분포에 대한 평균, 중앙값, 모드 및 표준 편차 간의 가능한 관계를 보여줍니다. 실제로 3은 양수, 음수, 0 또는 무한의 값을 가질 수 있습니다. E|Xk|kX
Henry

1
내가 조금 조밀 한 것일 수도 있습니다 (처음이 아닐 것입니다). 어떻게(1)과 (3)에서 오는가? |Mμ|3|μm|
Glen_b

9

이 논문은 몇 가지 중요한 정보를 제공한다고 지적합니다.이 정보는 일반적인 규칙에 가깝지 않음을 보여줍니다 (와 이블과 같이 연속적이고 매끄럽고 "훌륭하게 작동하는"변수의 경우에도 해당). 따라서 종종 사실 일 수도 있지만, 그렇지 않은 경우가 많습니다.

피어슨은 어디에서 왔을까요? 그는이 근사에 어떻게 도달 했습니까?

다행스럽게도 피어슨은 그 자체로 답을 알려줍니다.

우리가 사용하는 의미에서 "비뚤어 짐"이라는 용어의 첫 번째 사용은 Pearson, 1895 [1] (제목에 바로 나타남) 인 것 같습니다. 이 백서는 또한 모드 (footnote, p345) 라는 용어를 소개합니다 .

최대 주파수의 세로 좌표에 해당하는 가로 좌표에 모드 라는 용어를 사용하는 것이 편리하다는 것을 알았습니다 . "평균", "모드"및 "중앙값"은 통계 학자에게 중요한 고유 한 특성을 모두 가지고 있습니다.

또한 그의 주파수 곡선 시스템에 대한 그의 최초의 디테일 인 것으로 보인다 .

따라서 Pearson Type III 분포 (이제 우리는 아마도 감마-이동 된 것으로 감마) 에서 모양 매개 변수의 추정에 대해 논의 할 때 다음과 같이 말합니다 (p375).

평균, 중앙값 및 모드 또는 최대 좌표는 각각 bb , ccaa 로 표시되며 , 곡선이 그려지 자마자 세 가지 수량의 위치 사이에 놀라운 관계가 나타납니다. 길이로 양수 *은 평균으로부터 1/3 관한 것으로 보였다 된 최대 향해p

* 이것은 모양 매개 변수가 감마에 해당합니다.>1

여기서 "maximum"의 의도 는 무작위 변수의 최대 값이 아니라 따옴표의 시작 부분에서 분명한 것처럼 최대 주파수 의 값 (모드)입니다.x

실제로 감마 분포에 대한 (평균-모드)와 (평균-중앙)의 비율을 살펴보면 다음을 관찰 할 수 있습니다.

여기에 이미지 설명을 입력하십시오

(파란색 부분은 피어슨이 근사치가 합리적이라고 말합니다.)

실제로 Pearson 시스템의 다른 배포판 (예 : 베타 배포판)을 보면 및 가 너무 작지 않은 한 거의 동일한 비율이 유지됩니다 .αβ

여기에 이미지 설명을 입력하십시오

( 가 순간적으로 왜곡 되어 나타나기 때문에 베타 버전의 특정 하위 항목을 선택 했습니다. 이러한 방식이 증가 상수 . 모멘트 비대칭 감소에 대응 흥미롭게의 값 및 되도록 , 곡선은 거의 일정하고 (평균 모드) / (평균 평균), 는 충분히 크지 만 보다 작은 경우에는 최소값이있을 수 있습니다.βα=kβααβααββ+α=cβ+αα및 )β

역 감마는 Pearson 시스템에도 있습니다. 그것도 모양 매개 변수의 큰 값 (대략 )과 관계가 있습니다.α>10

여기에 이미지 설명을 입력하십시오

Pearson도 대수 정규 분포에 익숙 할 것으로 예상됩니다. 이 경우 모드, 중앙값 및 평균은 각각 및 . 그의 시스템을 개발하기 전에 논의되었으며 종종 Galton과 관련이 있습니다.eμσ2,eμeμ+σ2/2

(mean-mode) / (mean-median)을 다시 살펴 보겠습니다. 분자와 분모 모두에서 인수를 취소하면 . 첫 번째 순서 ( 가 작을 때 정확함 )의 분자는 이고 분모는 . 적어도 작은 경우 로그 정규 값을 유지해야합니다.eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

잘 알려진 많은 분포가 있는데, 그 중 몇 가지는 Pearson이 잘 알고 있었으며 광범위한 매개 변수 값에 대해 사실에 가깝습니다. 그는 감마 분포로이를 알아 차 렸지만 그가 고려할 다른 분포를 보았을 때 그 아이디어를 확인했을 것입니다.

[1] : Pearson, K. (1895),
"진화의 수학적 이론에 대한 기여, II : 균질 물질의
비대칭 변형" , 왕립 학회의 철학적 거래, 시리즈 A, 186, 343-414
[저작권. 여기에서 자유롭게 이용 가능 ]


4

이 관계는 파생되지 않았습니다. 거의 대칭적인 분포를 경험적으로 유지하는 것으로 나타났습니다 . 통계 이론 소개 , (1922), p.121, VII 장 20 절 에서 Yule의 설명을 참조하십시오 . 그는 실험적인 예를 제시합니다.


+1 실제로, Pearson 1895의 인용문은 그것이 파생 된 것이 아니라 그가 주목 한 것임을 나타냅니다.
Glen_b

2
오래된 수학 텍스트는 오늘날의 글보다 훨씬 재미 있습니다
Aksakal
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.