평균 = 중앙값은 단봉 분포가 대칭임을 의미합니까?


19

단봉 분포의 경우 평균 = 중앙값이면 분포가 대칭이라고 말하는 것으로 충분합니까?

Wikipedia는 평균과 중앙값 사이의 관계 에서 다음 같이 말합니다 .

"분포가 대칭이면 평균은 중앙값과 같고 분포는 왜도를 갖지 않습니다. 또한 분포가 단조로운 경우 평균 = 중앙값 = 모드입니다. 이것은 동전 던지기 또는 series 1,2,3,4, ... 그러나, 그 대화는 일반적으로 사실이 아니며, 즉 제로 왜도는 평균이 중앙값과 같다는 것을 의미하지는 않습니다. "

그러나 필요한 정보를 수집하는 것은 매우 간단하지 않습니다. 도와주세요.

답변:


27

다음은 대칭이 아닌 작은 반례입니다. -3, -2, 0, 0, 1, 4는 mode = median = mean = 0 인 단일체입니다.

편집 : 더 작은 예는 -2, -1, 0, 0, 3입니다.

표본이 아닌 임의의 변수를 상상하려면 확률 질량 함수 0.2를 사용하여 {-2, -1, 0, 3}으로지지를 받으십시오 (0 인 경우 0.4 제외).


6
-2, -1, 0, 0, 3은 "가장 작은"이산 카운터 예제라고 생각합니다. 모드를 만들려면 두 개의 동일한 값이 필요합니다. 세 번째 고유 한 값을 추가하면 평균 같은 중앙값을 방지 할 수 있으며 네 번째 값은 대칭을 복원하여 중앙값을 같게하는 것을 의미합니다. 또한이 숫자는 가능한 "가장 작은"(0에 가까운) 정수라고 생각합니다. 3은 2 개의 별개의 정수의 합으로 쓸 수있는 가장 작은 정수입니다. -1, -1, 0, 0, 2를 시도하는 것이 더 이상 단조롭지 않기 때문에 구별 이 중요합니다! 당연히이 속성으로 새로운 데이터 세트를 얻도록 스케일링하고 변환 할 수 있습니다.
Silverfish

19

이것은 주석으로 시작되었지만 너무 길어졌습니다. 나는 그것을 더 많은 답으로 만들기로 결정했다.

추가 문제를 다루고 여기에 어느 정도 관련된 광범위한 답변을 지적하고 싶습니다.

  1. 귀하가 인용 한 Wikipedia 페이지의 진술도 사실이 아닙니다. 예를 들어, Cauchy 분포는 중간 값에 대해 확실히 대칭이지만 평균은 없습니다. 이 문장에는 '평균과 왜곡이 있음'과 같은 한정자가 필요합니다. 첫 문장의 전반부에서 약한 문장으로 줄이더라도 "평균이 존재한다면"여전히 필요합니다.

  2. 귀하의 질문은 비대칭으로 왜곡을 부분적으로 확대합니다 (제 3 순간 왜도를 의도한다고 가정하지만 다른 왜도 측정에 대해서는 유사한 토론을 작성할 수 있습니다). 왜도가 0 인 것은 대칭을 의미하지 않습니다. 인용문의 뒷부분과 Alexis가 인용 한 Wikipedia의 섹션에서 이것을 언급하지만 두 번째 인용문에 제공된 설명은 약간의 조정을 사용할 수 있습니다.

이 답변 은 세 번째 모멘트 왜곡과 평균과 중앙값 사이의 관계 방향이 약하다는 것을 보여줍니다 (세 번째 모멘트 왜곡과 두 번째 피어스 왜곡은 일치하지 않아도 됨).

이 답변의 항목 1은 Silverfish가 제공 한 것과 유사하지만 다른 별개의 반례를 제공합니다.

편집 : 마침내 내가 실제로 찾고 있던 단조로운 예를 파헤 쳤습니다.

에서 이 대답 나는 다음과 같은 가정을 언급 :

124특급(엑스1/4)[1α(엑스1/4)]

링크 된 답변의 특정 예에서 파란색과 녹색 밀도를 나타내는 두 가지 특정 구성원을 사용하십시오.α=0α=12

여기에 이미지 설명을 입력하십시오

(회색 선은 비대칭을 평평하게 만들기 위해 x 축을 중심으로 파란색 밀도를 뒤집 었음을 나타냅니다)

Whuber는 또 다른 예를 제공합니다 여기에 , 연속 단봉과 비대칭의 Zero 비대칭으로. 나는 그의 다이어그램을 재현했습니다.

연속적인 예

이것은 예와 비대칭을 명확하게 나타 내기 위해 평균에 대해 같은 것을 보여 주지만 많은 유용한 정보가 들어있는 원본을 읽어야합니다.

[Whuber의 답변은 여기서 동일한 순간을 가진 또 다른 비대칭 연속 분포 제품군을 제공합니다. 동일한 "두 개를 선택하고, 하나를 뒤집고 50-50 혼합을 사용하십시오." ]

답은 여기에 평균, 중앙값 및 모드 사이의 관계에 대해 설명합니다.

이 답변 은 대칭의 가설 검정에 대해 설명합니다.


많은 감사합니다. 이 stats.stackexchange.com/questions/56511/… 을 언급 한 것은 실제로 위의 질문을 한 원인입니다.
kaka

8

아니.

또한 분포가 단수형이면 평균 = 중앙값 = 모드입니다.

같은 방식으로 "아기 동물이 닭인 경우, 그 기원은 달걀이다"는 "원점이 달걀 인 경우, 아기 동물은 닭이다"는 의미는 아닙니다.

동일한 Wikipedia 기사에서 :

한쪽 꼬리는 길지만 다른 꼬리는 뚱뚱한 경우, 왜도는 간단한 규칙을 따르지 않습니다. 예를 들어, 값이 0이면 평균 분포의 양쪽에있는 꼬리가 대칭 분포와 비대칭 분포 (예 : 한쪽 꼬리는 길지만 얇음) 및 다른 사람은 짧지 만 뚱뚱합니다.


1
단봉 대칭형의 경우 최소 (0) 밀도의 평균 = meadian = 포인트를 가질 수 있습니다 (예제를 쉽게 구성 할 수 있음)!
kjetil b halvorsen

2

흥미롭고 이해하기 쉬운 예제는 이항 분포에서 비롯됩니다.

×=

            1        2
    +-------------------+
  1 |       0   .32768  |
  2 |       1    .4096  |
  3 |       2    .2048  |
  4 |       3    .0512  |
  5 |       4    .0064  |
  6 |       5   .00032  |
    +-------------------+

이 디스플레이의 Stata 코드는 mata : (0..5)' , binomialp(5, (0..5), 0.2)'아마도 언급 할만한 통계 소프트웨어에서 간단하거나 단순했을 것입니다.

논리가 아닌 심리학의 문제로,이 예는 병리학 적으로 (다른 문제에서 특정 순간이 존재하지 않는 분포를 할인 할 수 있음) 또는 목적을 위해 고안된 기괴하거나 사소한 예로 설득력있게 해고 될 수 없습니다 예를 들어 @Silverfish 또는 0, 0, 1, 1, 1, 3에 의해 기술 된 발명 된 데이터).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.