중앙값이 [Mode-Mean] 밖에있는 예


11

기사 는 내 리그 위에 있지만 내가 관심있는 주제, 평균, 모드 및 중간 간의 관계에 대해 이야기합니다. 그것은 말한다 :

단봉 분포의 중앙값은 평균과 모드 사이에서 "보통"이라고 널리 알려져 있습니다. 그러나 이것은 항상 사실이 아닙니다 ...

내 질문 : 누군가 중앙값이 [모드, 평균] 간격을 벗어난 연속 단봉 형 (이상적으로 간단한) 분포의 예를 제공 할 수 있습니까? 예를 들어와 같은 배포판 mode < mean < median입니다.

=== 편집 =======

Glen_b와 Francis는 이미 좋은 대답을 얻었지만 실제로 관심이있는 것은 mode <mean <median 또는 median <mean <mode (즉, 중간이 [mode, mean] AND median이 둘 다인 예입니다) 모드의 평균과 같은 쪽 (즉, 위 또는 아래 모드 모두). 나는 여기에 대한 답변을 받아 들일 수 있고 새로운 질문이 열려 있거나 누군가가 여기에 직접 해결책을 제안 할 수 있습니까?


더 제한적인 사례를 다루기 위해 답변을 연장하는 것은 문제가되지 않습니다.
Glen_b-복귀 모니카

2
중앙값이 모드와 평균 사이에 있지 않은 (연속적인 단조로운 ) Weibull 예제를 제공하는 ww2.amstat.org/publications/jse/v13n2/vonhippel.html 에서 그림 6을 확인하십시오 .
Matthew Towers

답변:


14

물론 중앙값이 평균과 모드 사이에 있지 않은 예를 찾기는 어렵지 않습니다.

  1. f t ( t ) = 2 ( 1 t ) 1 0 < t < 1 형식의 삼각 분포에서 iid를 고려하십시오.1,2에프()=2(1)10<<1

    이제하자 60-40의 혼합물 일 T 1- 4 T 2 .엑스142

    의 밀도는 다음과 같습니다.엑스

    모드-평균 간격 외부의 중앙값과 두 개의 삼각 밀도의 혼합

    평균은 0보다 낮고 모드는 0이지만 중앙값은 0보다 큽니다. 약간만 수정하면 cdf가 아닌 밀도조차 연속적이지만 위치 측정 간의 관계는 다음과 같습니다. 동일 (편집 : 아래 3. 참조).

  2. 일반화 하여, 전체 확률 의 비율 ( 0 < p < 1 )를 오른쪽 삼각형 에, 왼쪽 삼각형에 비율 를 (0.6 및 0.4 대신 넣겠습니다. 우리는 전에했다). 또한 왼쪽 절반의 가 아닌 ( ) 배율을 조정하십시오 .0<<1- β - 4 β > 0(1)β4β>0

    두 삼각형 밀도의 혼합물의 일반화 된 버전에 대한 밀도

    이제 라고 가정하면 중앙값은 항상 직각 삼각형이 적용되는 간격에 있으므로 중앙값이 모드를 초과합니다 (항상 ). 특히 인 경우 중앙값은 입니다. 0p>1>120 11/>1211/2

    평균은 있습니다.(β(1))/

    경우에는 경우에는 그 평균 모드 이하, 것이다 β < P / ( 1 - P ) 의 평균은 상기 모드 일 것이다.β>/(1)β</(1)

    반면에, 우리는 ( p β ( 1 p ) ) / 3 < 1 1 / √를 원합니다평균을 중앙값 아래로 유지하려면 2 p 를 누릅니다.(β(1))/<11/2

    고려하십시오 . 이것은 중앙값을 모드 위에 놓는다.=0.7

    그런 다음 β < p / ( 1 - p )를 만족 하므로 평균이 모드 위에 있습니다.β=2β</(1)

    중간이에서 실제로 평균은 동안 0.7 - 2 ( 0.3 )11/1.40.1548. 따라서p=0.7및인 경우 모드 <mean <median입니다.0.72(0.3)0.0333=0.7β=2

    (NB 내 표기법과 일관성을 유지하기 위해 두 플롯의 x 축 변수 는 아니라 여야 하지만 돌아가서 수정하지는 않습니다.)t엑스

  3. 밀도 자체가 연속적인 예입니다. 위의 1과 2의 접근 방식을 기반으로하지만 "점프"가 가파른 경사로 바뀐 다음 오른쪽 경사로 보이는 예를 원하기 때문에 전체 밀도가 약 0으로 바뀝니다.

    중간 <평균 <모드를 갖는 연속적인 조각 별 선형 밀도

    [은 "삼각 밀도의 혼합물을 사용"접근이 이제 우리는 15 %가 제 1 절에서 설명 된 삼각형 형태의 3 독립 스케일링 variates의 혼합물로서 생성 될 수 60 % - 3 T (2) 25 % (5) T 3. ]125

    위의 다이어그램에서 볼 수 있듯이 평균은 요청대로 중간에 있습니다.


  1. m_t_는 주석에서 Weibull을 언급합니다 (중간 값이 벗어남)[방법,mean]k

    특히,와 이블 모양 모수의 값이 작은 경우 분포가 오른쪽으로 치우쳐지고, 우리는 모드와 평균 사이의 중간 값의 중간 상황이 있으며,와 이블 모양 모수의 값이 크면 분포가 왼쪽으로 치우칩니다. 우리는 다시 "중간에 중앙값"상황을 갖습니다 (그러나 이제는 평균이 아닌 오른쪽에있는 모드로). 이러한 경우 사이에 중앙값이 평균 모드 간격을 벗어나는 작은 영역이 있으며 그 중간에 평균과 모드가 교차합니다.

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    위의 (1)과 (2)로 표시된 간격에서 위치 매개 변수에 대한 편리한 값을 선택하면 위치 통계 사이의 간격이 거의 같습니다.

    중간-평균 간격을 벗어난 중앙값을 갖는와 이블 밀도

    이것들은 요구 사항을 충족 시키지만 불행히도 3 개의 위치 매개 변수가 너무 가깝기 때문에 시각적으로 구별 할 수 없으므로 (모두 같은 픽셀에 빠짐) 조금 실망 스럽습니다. 이전 예제의 경우가 훨씬 더 많습니다. 분리. 그럼에도 불구하고 상황에 따라 다른 분포로 조사해야하는 상황이 제시되고 일부는 시각적으로 더 뚜렷한 결과를 제공 할 수 있습니다.


감사합니다. 호기심에서 모드 <평균 <중앙값과 유사한 "삼각 분포"는 무엇입니까? (여기서 중간 값 <모드 <평균)
Janthelme

4T21.25T20.60.4

6

다음 예는 Jordan Stoyanov의 확률에 대한 반례에서 발췌 한 것입니다 .

cλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmM엑스
μ=+2λ+λ2,미디엄=1,미디엄=.
에프(엑스)
22+λ=1.
1λ2>111.0001μ>미디엄=미디엄μ미디엄

0

0 <= x <무한대에 대해 비율 매개 변수 a 및 밀도 exp (-ax)를 사용하여 지수 분포를 취하십시오. 모드가 0입니다. 물론 평균과 중앙값은 0보다 큽니다. cdf는 1-exp (-ax)입니다. 따라서 x의 exp (-ax) = 0.5에 대한 중앙값 풀의 경우. 그런 다음 -ax = ln (0.5) 또는 x = -ln (0.5) / a입니다. 평균은 0에서 무한대까지 ax exp (-ax)를 적분합니다. a = 1을 취하면 중앙값 = -ln (0.5) = ln (2)이고 평균은 1입니다.

따라서 모드 <median <mean.


1
죄송합니다. mode <mean <median (또는보다 일반적으로 median이 [mode, average] 밖에있는) 분포를 찾고 있지 않습니까?
Janthelme

3
혼란스러워서 미안하지만, 나는 원래의 질문에 덧붙였지만, 내가 원래 묻던 것은 중간 값이 [모드, 평균] 밖에 있고 예제에서 중간 값이 [모드, 중간] 안에 있다고 생각하는 예입니다.
Janthelme

3
마이클, 질문은 중앙값이 모드와 평균 사이에있는 경우를 요구하지 않습니다. 이 글 바로 위의 주석에서 원본을 잘못 인용했습니다. 질문은 "mode <median <mean"이라고 말하지 않으며 (편집 기록의 어느 시점에서도 그렇게하지 않았습니다). 결과적으로 귀하의 답변은 요청되지 않은 사례를 제공합니다. 실제로 그것은 질문이 예외를 찾는 일반적인 상황 (다른 두 가지 중간에있는 중앙값)입니다. 거의 모든 잘 알려진 왜곡 된 단봉 분포는 중간에 중앙값을 갖습니다. 트릭은 그렇게하지 않는 것을 찾는 것입니다.
Glen_b-복지 주 모니카

1
편집 기록은 질문의 맨 아래에있는 "18 시간 전에 편집 한"이라는 빨간색 링크를 클릭하면 사용할 수 있습니다 (이 주석을 입력하는 동안 19로 변경됨). 편집 내역을 클릭하면 편집 내역을 볼 수 있습니다. 질문은 22 시간 전에 게시되었으며 (지금 입력 한대로) 편집 기록을 클릭하면 "1"이라는 맨 아래에 원래 질문이 표시됩니다. 귀하의 답변은 약 2 시간 후 (20 시간 전)에 나타났습니다. 게시물 후 약 1-2 시간 후에 OP는 질문을 한 번 수정했습니다.
Glen_b -Reinstate Monica

1
ctd ... 편집 기록의 맨 위에 있습니다. 각 편집 후에는 편집의 일부로 계산을 변경하기위한 2 분의 창이 있습니다 (예 : 22 시간 전과 18-19 시간 전). 오타가 수정되었을 때마다 분 단위로 표시되지만 ~ 20 시간 전에 게시했을 때 질문은 약 2 시간 동안 변경되지 않았으며 게시 한 후 주요 편집 ( 편집 기록에 표시됨)을 수행했습니다. 편집 후 2 분의 짧은 편집 기간 이외의 모든 편집 내용은 편집 기록에 있습니다.
Glen_b-복지 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.