비정규 분포에서 기대 값이 평균, 중앙값 등과 어떻게 관련이 있습니까?


9

연속 랜덤 변수의 예상 값이 비정규 분포 (예 : 스큐-정규)에서 산술 평균, 중간 값 등과 어떻게 관련이 있습니까? 나는 공통 / 흥미로운 분포 (예 : 로그 정규, 단순 이중 / 다중 분포, 이상하고 멋진 것)에 관심이 있습니다.

나는 주로 정성적인 답변을 찾고 있지만 모든 양적 또는 공식적인 답변도 환영합니다. 특히 시각적으로 더 명확하게 표현하고 싶습니다.


좀 더 명확하게 할 수 있습니까? 산술 평균 및 중앙값은 특정 분포에 내재 된 것이 아니라 데이터에 적용하는 함수입니다. 예를 들어 표본 평균을 계산하기 위해 데이터가 정규일 필요는 없습니다.
손님

문제는 기술적으로 "예상 값 이 특정 확률 분포에서 무작위로 추출데이터 의 평균, 중간 값 등과 어떻게 관련이 있습니까?" 분포가 더 치우치면 중앙값과 평균이 더 떨어져 있고 중앙값이 데이터의 위치를 ​​더 잘 나타낼 수 있다고 직관적으로 말할 수있는 방법과 유사한 단순하고 직관적 인 이해를 찾고 있습니다.
naught101

허. 고마워 마르코 나는 분명히 잘못 읽고 있습니다. 답변으로, 나는 그가 최선의 답변으로 그것을 선택하겠다는 것을 쓸 수 있습니다.
naught101

답변:


8

(위의 삭제 된 의견에서 부분적으로 변환 됨)

기대 값과 산술 평균은 정확히 같습니다. 중앙값은 사소한 방식으로 평균과 관련이 있지만 관계에 대해 몇 가지를 말할 수 있습니다.

  • 분포가 대칭 인 경우 평균과 중앙값이 동일

  • 분포가 음으로 치우친 경우 중앙값은 일반적으로 평균보다

  • 분포가 양으로 치우친 경우 중앙값은 일반적으로 평균보다 작습니다.


흥미 롭군 평균이 중앙값보다 큰 음으로 치우친 분포 의 비정상적인 동작 에는 어떤 예가 있습니까?
naught101

@ naught101 : 이것은 오타입니까? 음으로 치우친 분포는 왼쪽 중앙 결과가 오른쪽 중앙 결과보다 더 자주 발생하므로 저주파수 결과의 "꼬리"가 오른쪽으로 나옵니다. 이러한 상황에서 왼쪽의 혹은 항상 중앙의 (산술) 평균을 당기고 오른쪽의 꼬리는 평균보다 평균을 크게 유지합니다.
Assad Ebrahim

@AssadEbrahim : 아니요, 매크로의 주석에 대한 참조였습니다. "중앙값이 평균보다 일반적으로 큽니다." -반대 사례를 요구했습니다.
naught101

@ naught101 : 단봉 분포의 경우 반대 예는 다음 행입니다. 혹이 오른쪽에 있으면 왼쪽의 꼬리가 평균 아래의 중앙값을 당깁니다. 꼬리가 길수록 중앙값과 평균 사이의 간격이 더 큽니다.
Assad Ebrahim 8

1
평균 이상의 평균을 사용하거나 그 반대의 실제 상황은 무엇입니까? 예를 들어, 수명이 지수 분포를 따르는 생존 분석에서 생명 / 사망을 2 진으로 예측해야하는 경우 중간 값 (따라서 반이 더 길고 반이 짧음) 또는 평균 ( "예상"수명)을 사용해야합니까? 결과?
drevicko 2016 년

5

로그 정규 분포의 랜덤 변수 의 고조파, 기하학 및 산술 평균 사이에는 좋은 관계가 있습니다. 허락하다XLN(μ,σ2)

  • HM(X)=eμ12σ2 (고조파 평균),
  • GM(X)=eμ (기하학적 평균),
  • AM(X)=eμ+12σ2 (산술 평균).

고조파와 산술 평균의 곱이 기하 평균의 제곱을 산출하는 것을 보는 것은 어렵지 않습니다.

HM(X)AM(X)=GM2(X).

모든 값이 긍정적이기 때문에, 우리는의 squre 뿌리를 가지고 있음을 확인할 수 의 기하 평균 의 조화 평균의 기하 평균 인 와의 산술 평균XXX , 즉

GM(X)=HM(X)AM(X).

또한, 잘 알려진 HM-GM-AM 불평등

HM(X)GM(X)AM(X)

로 표현 될 수있다

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

여기서 는 기하 분산입니다.GVar(X)=eσ2


1

완전성을 위해 평균이 잘 정의되지 않은 분포도 있습니다. 전형적인 예는 Cauchy 분포입니다 ( 이 답변 에는 이유에 대한 좋은 설명이 있습니다). 또 다른 중요한 예는 지수가 2보다 작은 파레토 분포 입니다.


1
여러 개의 iff. 권력 법은 배포가 아니라 파레토 분포는 권력 법입니다. 이것은 로그-볼록한 전력 함수의 비 통합 성과 관련이 있습니다.x=0. 권력 법의 경우, 2보다 작거나 2보다 크지 않음을 의미합니다.
Carl

@ Carl good points-그에 따라 답을 편집했습니다. 많은 thx (:
drevicko

0

수학적으로 평균과 기대 값이 동일하게 정의되는 것이 맞지만, 비대칭 분포에 대해서는이 명명 규칙이 오도됩니다.

도시의 주택 가격에 대해 친구에게 물어보고 실제로 그 도시로 이사하는 것에 대해 생각하기 때문에 친구에게 물어보고 있다고 상상해보십시오.

주택 상금의 분배가 단조롭고 대칭 적이라면 친구는 주택의 평균 가격을 말할 수 있으며 실제로 그 평균 가치를 중심으로 시장에서 대부분의 주택을 찾을 것으로 기대할 수 있습니다 .

그러나 주택 가격의 분포가 단조롭고 왜곡 된 경우 (예 : 오른쪽으로 낮은 가격 범위에있는 대부분의 주택이 오른쪽으로 기울어 져 있고 오른쪽에 일부 비옥 한 주택 만있는 경우 평균이 "높은 가격으로 기울어 짐" 권리.

이 단봉, 왜곡 된 주택 가격 분포를 들어 다음을 수행 할 수 있습니다 기대 주위에 시장에서 대부분의 주택을 찾기 위해 중간 .


1
비스듬한 단봉 분포에 대해 말할 때의 의미는 확실하지 않습니다. 말할 수있는 것은 값의 절반이 중앙값 이하이거나 중앙값이 절반 이상이라는 것입니다. 이 값이 평균에 얼마나 가까운 지 나타내지는 않습니다.
Michael R. Chernick

마지막 문장이 "중간 값"으로 끝나야한다고 생각합니까? 그렇다면 중간 값이 위에서 설명한 모집단에서 추출한 무작위 표본의 평균값 (예 : 주택 가격이 아닐 수 있음)에 가장 가까운 (달성 가능) 값이어야한다는 것이 분명하다고 생각합니다. 즉, 중앙값은 평균 평균 샘플에 가장 가깝습니다. 그렇지 않다면, 나는이 값들이 평균에 얼마나 가까운 지에 대해서는 주장하지 않았다. 나는 중간 거리까지의 거리에 대해 주장했다.
Sol Hator
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.