어떤 "평균"을 언제 사용해야합니까?


197

따라서 산술 평균 (AM), 기하 평균 (GM) 및 고조파 평균 (HM)이 있습니다. 그들의 수학적 공식은 관련 고정 관념과 함께 잘 알려져 있습니다 (예 : 조화 평균 및 '속도'관련 문제에 적용).

그러나 항상 저를 흥미롭게 한 질문은 "어떻게 어떤 맥락이 주어진 맥락에서 사용하기에 가장 적합한지를 결정합니까?"입니다. 적용 가능성을 이해하는 데 도움 이 되는 최소한의 경험 법칙 이 있어야 하지만 가장 많이 접하는 대답은 "의존" (그러나 무엇에 달려 있습니까?)입니다.

이것은 다소 사소한 질문처럼 보이지만 고등학교 교과서조차도 이것을 설명하지 못했습니다. 수학적 정의 만 제공합니다!

나는 수학적 설명보다 영어 설명을 선호합니다. 간단한 시험은 "엄마 / 아이가 이해할 수 있을까요?"


20
이것은 아마도 지나치게 단순화되었지만 항상 범위와 관찰을 사용했습니다. 범위가 동일 = AM (점수 0-100, 0-100 비교) 인 경우 범위가 다르지만 관측치가 같음 = GM (점수 1-5, 0-10 비교), 범위가 동일하지만 관측치 인 경우 다른 = HM (다른 obs에서 자동차의 속도, 두 사다리의 높이, 다른 "속도").
Brandon Bertelsen

> "그것은 달려있다"(하지만 무엇에 달려 있습니까?) 그것은 데이터 처리 알고리즘에 달려 있습니다.
Macson

그것은 단지 어떤 의미를 사용해야 하는가가 아닙니다. 또한 모집단 또는 관심있는 프로세스를 설명하기 위해 어떤 요약 통계 세트를 선택합니다. 필요한 것은 모두 복잡한 것을 설명하기 위해 하나의 숫자라고 생각해서는 안됩니다.
JimB

답변:


160

이 답변은 당신이 찾고있는 것보다 약간 더 수학적으로 구부러져있을 수 있습니다.

인식해야 할 중요한 것은이 모든 수단이 단순히 산술적 인 산술 수단이라는 것 입니다 .

세 가지 공통 수단 (산술, 기하 또는 고조파) 중 어느 것이 "올바른"인지 식별하는 데있어 중요한 특성은 해당 문제에서 "추가 구조"를 찾는 것입니다.

다시 말해 추상적 인 수량 이 주어 졌다고 가정하겠습니다 . 이것은 "측정"이라고 부르며, 일관성을 위해 아래에서이 용어를 다소 남용합니다. 이 세 가지 수단은 각각 (1) 각 를 일부 로 변환 하고 (2) 산술 평균을 취한 다음 (3) 원래 측정 척도로 다시 변환하여 얻을 수 있습니다.x i y ix1,x2,,xnxiyi

산술 평균 : 분명히 "identity"변환을 사용합니다 : . 따라서 단계 (1)과 (3)은 사소한 것이며 (아무 것도 수행되지 않음) 입니다.ˉ x A M = ˉ yyi=xix¯AM=y¯

기하 평균 : 여기에 추가 구조는 원래 관측치의 로그에 있습니다. 그래서 우리는 걸릴 단계에서 GM을 얻기 위해 다음 (3) 우리는의 역함수를 통해 다시 변환 , 즉, . log ˉ x G M = exp ( ˉ y )yi=logxilogx¯GM=exp(y¯)

고조파 평균 : 여기에 가산 구조는 관측치 의 역수 에 있습니다. 그래서 , 어디서 .ˉ x H M = 1 / ˉ yyi=1/xix¯HM=1/y¯

물리적 문제에서 이러한 문제는 종종 다음 프로세스를 통해 발생합니다. 측정 및 과 같은 다른 수량과 관련하여 고정 된 수량 가 있습니다 . 이제 우리는 다음과 같은 게임을한다 : 와 일정하게 유지하고 각각 의 개별 관측 값 를 바꾸 더라도 "total"관계는 여전히 보존 되도록 를 찾는다 .x 1 , , x n z 1 , , z n w z 1 + + z n ˉ x x i ˉ xwx1,,xnz1,,znwz1++znx¯xix¯

거리-속도-시각 예제가 널리 사용되는 것으로 보이므로 사용하십시오.

일정한 거리, 다양한 시간

고정 거리 이동 고려하십시오 . 이제이 거리 다른 속도로 하고 시간 한다고 가정 해 봅시다 . 우리는 이제 게임을한다. 총 시간이 일정하게 유지되도록 개별 속도를 고정 속도 로 바꾸고 싶다고 가정 해 봅시다 . 우리는 이므로 입니다. 게임에서 각 를 로 바꿀 때이 전체 관계 (총 시간 및 이동 거리)가 보존 되기를 원합니다 . 따라서 n v 1 , , v n t 1 , , t n ˉ v d v i t i = 0dnv1,,vnt1,,tnv¯i ( d v i t i ) = 0 v i ˉ v n d ˉ v i t i = 0

dviti=0,
i(dviti)=0viv¯t i = d / v i ˉ v = n
ndv¯iti=0,
각각의 이므로 ti=d/vi
v¯=n1v1++1vn=v¯HM.

여기서 "첨가 구조"는 개별 시간과 관련이 있으며 측정 값은 반비례하므로 고조파 평균이 적용됩니다.

다양한 거리, 일정한 시간

이제 상황을 바꿔 봅시다. 인스턴스에 대해 거리 걸쳐 속도 에서 고정 시간 를 이동 한다고 가정합니다 . 이제 전체 거리를 보존하려고합니다. 우리는 이면 전체 시스템이 보존됩니다 . 다시 우리의 게임을, 우리가 추구 등이 하지만, 이후 , 우리가 얻을 ntv1,,vnd1,,dn

divit=0,
i(divit)=0v¯
i(div¯t)=0,
di=vit
v¯=1nivi=v¯AM.

여기에서 우리가 유지하려고하는 추가 구조는 우리가 가지고있는 측정에 비례하므로 산술 평균이 적용됩니다.

동일한 볼륨 큐브

주어진 부피 로 차원 상자를 구성 했고 측정이 상자의 측면 길이라고 가정합니다. 그런 다음 , 같은 부피 의 차원 (하이퍼) 큐브 를 구성한다고 가정 합니다. 즉, 개별 측면 길이 를 일반적인 측면 길이 로 바꾸려고합니다 . 그런 다음 nV

V=x1x2xn,
nxix¯
V=x¯x¯x¯=x¯n.

이는 을 가져야한다는 것을 쉽게 나타냅니다 .x¯=(xixn)1/n=x¯GM

추가 구조는 로그에 있습니다. 즉, 이며 왼쪽 수량을 보존하려고합니다.logV=ilogxi

옛날부터 새로운 수단

연습으로, 첫 번째 예에서 거리와 시간이 모두 달라지는 상황에서 "자연"의 의미가 무엇인지 생각해보십시오. 즉, 거리 , 속도 및 시간 있습니다. 우리는 이동 한 총 거리와 시간을 보존하고 이를 달성하기 위해 일정한 를 찾고 싶습니다 .v i t i ˉ vdivitiv¯

연습 :이 상황에서 "자연스러운"의미는 무엇입니까?


25
+1 이것은 훌륭한 답변입니다. 그러나 나는 그것이 중요한 방식으로 불완전하다고 생각합니다. 많은 경우에, 올바른 사용 수단은 데이터의 수학적 구조가 아니라 우리가 대답하려는 질문에 의해 결정됩니다 . 이에 대한 좋은 예는 환경 위험 평가에서 발생합니다. 규제 당국은 시간이 지남에 따라 오염 물질에 대한 전체 인구 노출을 추정하려고합니다. 비록 환경 농도 데이터가 일반적으로 곱셈 구조를 갖더라도, 이것은 적절한 가중 산술 평균을 요구 합니다 . 기하 평균은 잘못된 추정기 또는 추정치입니다.
whuber

7
@ whuber : (+ 1) 이것은 훌륭한 의견입니다. 대답을 구성하는 길에서 결정적으로 비 통계적 포크를 사용했기 때문에 이것을 언급하게되어 기쁩니다. 완전한 답변 ( 힌트 )에 적합한 주제 입니다.
추기경

9
@whuber : 또한 통계 분석에 종종 도메인 전문가 (또는 아마도 전문가가 아닌 사람도 있음)의 감독이 필요할 수 있다는 사실을 알 수 있습니다. 통계적으로 부자연 스럽습니다. 과거에 내가 겪었던 문제는 때로는 통계적 추정이 수행되는 방식을 지시하기를 원한다는 것입니다! :)
추기경

1
@ whuber : 정교하게 답변에 그 견해를 추가 할 수 있다면 대단히 감사하겠습니다. 솔직히, 귀하의 설명은 Stats.SE에서 본 것 중 최고입니다!
PhD

3
@whuber의 평소 좋은 의견. 때때로 (아마도 종종!) 사용하는 올바른 수단은 none입니다 . 오히려 질문은 종종 "어떤 중심 경향을 사용해야합니까?"로 확대되어야합니다.
Peter Flom

43

@Brandon의 훌륭한 의견 확장 (답변하도록 홍보해야한다고 생각합니다) :

곱하기 차이에 관심이있는 경우 기하 평균을 사용해야합니다. Brandon은 범위가 다른 경우 기하 평균을 사용해야한다고 지적합니다. 이것은 일반적으로 맞습니다. 그 이유는 범위를 균등하게 만들고 싶어하기 때문입니다. 예를 들어, 대학 지원자가 SAT 점수 (0-800), HS (0-4)의 평균 점수 및 과외 활동 (1-10)에 등급이 있다고 가정합니다. 만약 대학이 이들을 평균화하고 범위를 균등화하기를 원한다면 (즉, 범위에 비해 각 질에서 체중 증가) 기하학적 평균이 갈 길입니다.

그러나 범위가 다른 스케일을 사용하는 경우 항상 그런 것은 아닙니다 . 우리가 다른 나라 (가난하고 부유 한 나라를 포함하여)에서 수입을 비교한다면, 우리는 아마도 기하 평균이 아니라 산술 평균 (또는 아마도 중간 또는 트림 된 평균)을 원할 것입니다.

고조파 평균으로 본 유일한 용도는 속도를 비교하는 것입니다. 예를 들어 : 당신은 40 MPH에서 보스턴 뉴욕에서 자동차와 경우 전체 평균은 60 MPH에 반환 하지 50 MPH의 산술 평균,하지만 조화 평균.

(40+60)/2=502/(1/40+1/60)=48

240/5=48


3
왜 SAT / GPA / 외과 적 예가 가중 또는 스케일 산술 평균이 아닌 기하 평균을 사용합니까? SAT 또는 GPA가 0 인 이유가 다른 두 값이 관련이 없다는 것을 의미해야하는 이유는 무엇입니까 (기하학적 평균이 의미하는 것처럼)? 과외 활동이 이론적 범위보다 훨씬 좁은 대역에 모이는 경향이 있다면 어떨까요? 원시 값의 기하 평균보다 백분위 수 (또는 기타 조정 된 값)의 산술 평균을 취하는 것이 더 의미가있는 것 같습니다.
ruakh

1
@ruakh 흥미로운. SAT와 GPA가 실제로 0 일 수 없으므로이 문제에서 0 문제는 실제로 중요하지 않습니다 (SAT = 0은 거의 불가능하며 0의 GPA는 졸업하지 않습니다). 백분위 수의 산술 평균은 결론에서 기하학적 평균에 가깝다고 생각합니다 (실제 숫자는 아니지만).
Peter Flom

31

나는 이것을 3-4 규칙으로 정리하고 피타고라스 수단의 더 많은 예를 제공하려고 노력할 것입니다.

3 가지 평균 간의 관계는 약간의 차이가있는 음이 아닌 데이터의 경우 HM <GM <AM입니다 . 샘플 데이터에 전혀 변화가없는 경우에만 동일합니다.

레벨의 데이터에는 AM을 사용하십시오. 가격이 좋은 예입니다. 비율은 GM을 사용하십시오. 투자 수익, Bloomberg Billy 지수 (미국 가격 대비 다양한 국가의 Ikea Billy 책장 가격) ​​및 UN의 인간 개발 지수와 같은 상대 가격이 모두 예입니다. HM은 요금을 처리 할 때 적합합니다. David Giles가 제공 한 비 자동차 사례는 다음과 같습니다 .

예를 들어 "주당 근무 시간"(요금)에 대한 데이터를 고려하십시오. 각각 총 2,000 시간을 일하는 4 명 (샘플 관찰)이 있다고 가정합니다. 그러나 다음과 같이 주당 다른 시간 수로 작동합니다.

Person      Total Hours       Hours per Week          Weeks Taken
1                  2,000                  40                   50
2                  2,000                  45                   44.4444
3                  2,000                  35                   57.142857
4                  2,000                  50                   40

Total:           8,000                                       191.587297

세 번째 열의 값의 산술 평균은 주당 AM = 42.5 시간입니다. 그러나이 값의 의미에 유의하십시오. 표본 구성원 (8,000)이 일한 총 주 수를이 평균 값으로 나누면 4 명의 모든 주가 일한 총 주 수가 188.2353이됩니다.

이제 위 표의 마지막 열을보십시오. 실제로 샘플 멤버가 작업 한 총 주 수의 정확한 값은 191.5873 주입니다. 표의 세 번째 열에서 주당 시간 값에 대한 고조파 평균을 계산하면 HM = 41.75642 시간 (<AM)이되고이 숫자를 8,000 시간으로 나누면 총 수에 대해 191.5873의 정확한 결과를 얻을 수 있습니다. 몇 주 일했다. 고조파 평균이 샘플 평균에 대한 적절한 측정 값을 제공하는 경우입니다.

David는 또한 인플레이션을 측정하는 데 사용되는 가격 지수로 나타나는 3 가지 수단의 가중치 버전에 대해서도 설명합니다.

가로 채기 :

이 ROT는 완벽하지 않습니다. 예를 들어, 종종 무언가가 비율인지 비율인지 알아내는 것이 어렵다는 것을 알게됩니다. 투자 수익률은 일반적으로 평균을 계산할 때 비율로 처리되지만 일반적으로 "시간 단위당 x %"로 표시되기 때문에 비율입니다. "데이터가 단위당 레벨 일 때 HM을 사용하는 것"이 ​​더 나은 휴리스틱입니까?

북유럽 국가 의 Big Mac 지수 를 요약 하려면 GM을 사용 하시겠습니까?


3
몇 년 늦었지만 "북유럽 국가의 Big Mac 지수를 요약하려면 GM을 사용 하시겠습니까?"라는 질문에 대한 답을 찾은 적이 있습니까? ?
StatsScared

2
@StatsScared Nope, 그러나 좋은 질문이 될 것입니다!
Dimitriy V. Masterov 2019

7

귀하의 질문에 대한 가능한 대답은 (“어떤 평균이 주어진 맥락에서 사용하기에 가장 적합한지를 어떻게 결정합니까?”) 이탈리아 수학자 Oscar Chisini가 제공 한 평균의 정의입니다 .

다음 은 더 자세한 설명과 몇 가지 예 (평균 이동 속도 등)가 포함 된 논문입니다.


6
링크가 끊어졌을 때 Chisini의 정의에 대해 몇 줄을 추가하거나 아이디어를 더 추구하기 위해 링크를 클릭하려는 독자가 이해할 수 있도록하는 것이 이상적입니다.
gung

2
실제로, 종이와의 연결이 끊어졌습니다. Wolfram 링크는 Chisini 정의가 주어진 맥락에서 사용할 평균을 결정하는 데 어떻게 유용한 지에 대한 통찰력을 제공하지 않습니다. 그것은 처방전이 아닌 수학적 일반화 인 것 같습니다.
Ryan Simmons

1
DOI를 사용하면 논문이 tandfonline.com으로 이동되었음을 알 수 있습니다. 인용 : R Graziani, P Veronese (2009). 평균을 계산하는 방법? Chisini 접근 방식 및 해당 애플리케이션. 미국 통계 학자 63 (1), pp. 33-36. tandfonline.com/doi/abs/10.1198/tast.2009.0006
akraf

0

질문에 대답하는 간단한 방법은 다음과 같습니다.

  1. 수학적 구조가 xy = k (변수 사이의 역관계)이고 평균을 찾고 있다면, 가중 산술 평균에 해당하는 고조파 평균을 사용해야합니다.

고조파 평균 = 2ab / (a ​​+ b) = a (b / a + b) + b (a / (a ​​+ b)

예를 들어, 투자하는 금액 (A)은 고정되어 있지만 주당 가격 (P)과 주식 수 (N)는 다양하므로 (A = PN) 달러 비용 평균화가이 범주에 속합니다. 실제로 산술 평균을 두 숫자 사이의 동일 중심 숫자로 생각하면 고조파 평균도 두 숫자 사이의 동일 중심 숫자이지만 "중심"은 백분율 (비)이있는 곳입니다. 같은. 즉 : (x-a) / a = (b -x) / b, 여기서 x는 고조파 평균입니다.

  1. 수학적 구조가 직접 변동 y = kx 인 경우 산술 평균을 사용합니다.이 경우 고조파 평균이 줄어 듭니다.

1
$x$x\frac{a}{b}ab

여러 모델의 확률을 평균 앙상블하고 싶다고 가정 해 봅시다. 이 경우 기하학적 또는 고조파 평균을 사용하는 것이 합리적입니까?
thecity2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.