왜 우리는 고조파 평균 대신 가중 산술 평균을 사용하지 않습니까?


12

정밀도와 리콜을 결합하는 가중 산술 평균과 달리 고조파 평균을 사용하여 (예 : F- 측정을 계산하는) 본질적인 가치가 무엇인지 궁금합니다. 가중 산술 평균이 고조파 평균의 역할을 할 수 있다고 생각합니까, 아니면 뭔가 빠졌습니까?


9
고조파 평균 가중 산술 평균입니다. 각 의 가중치는 1 / x 2 i에 비례합니다 . xi1/xi2
whuber

이 방식으로 정밀도와 리콜이 어떻게 결합되는지에 대해 더 말할 수 있습니까?
AdamO

6
@whuber 귀하의 의견이 심각하거나 혀인지 확실하지 않습니다. 가중치는 일반적으로 샘플 값이 아니라 샘플 인덱스 의 함수로 간주됩니다 . 그렇지 않으면 모든 평균은 가중 산술 평균입니다
Luis Mendo

2
@Luis 진실은 사이에 있습니다. 표본 지수는 종종 의미가 없습니다. 가중치는 객체의 함수이지만 이러한 함수는 일반적으로 평균화되는 값에 의존하지 않습니다. 예는 시간 (EWMA), 위치 (공간 상관 측정 기준), 순위 (Shapiro-Wilk 테스트와 동일) 및 샘플링 확률과 관련된 가중치입니다. 그러나 모든 수단에 AM이 적용되는 것은 아닙니다. 예를 들어 GM은 그렇지 않습니다. Filippa는 "인스턴스 가치"에 대해 질문하기 때문에, 고조파 평균과 가중 평균 사이의 수학적 관계를 지적하는 것이 독일인처럼 보였다.
whuber

답변:


18

일반적으로 고조파 수단은 정수 대신 평균 속도를 계산할 때 선호됩니다. F1 측정의 경우, 고조파 평균은 매우 작은 정밀도 또는 리콜에 불이익을 주지만 비가 중 산술 평균은 그렇지 않습니다. 평균 100 %와 0 %를 상상해보십시오. 산술 평균은 50 %이고 고조파 평균은 0 %입니다. 고조파 평균은 정밀도와 리콜이 모두 높아야합니다.

또한, 정밀도와 리콜이 서로 가까우면 고조파 평균이 산술 평균에 가까워집니다. 예 : 산술 평균 92.5 %에 비해 95 % 및 90 %의 고조파 평균은 92.4 %입니다.

이것이 바람직한 속성인지 여부는 사용 사례에 따라 다르지만 일반적으로 좋은 것으로 간주됩니다.

마지막으로 @whuber가 주석에서 언급했듯이 고조파 평균은 실제로 가중 산술 평균입니다.


2
1012010608010120106090

실제로, 첫 번째 단락은 고조파 평균에 대한 일반적인 설명입니다. 그러나 당신이 맞습니다. 정밀도와 리콜은 비율이 아니라 분수입니다. 해석 가능한 합산 (이 경우에는 적용되지 않음)이있는 값에는 산술 평균이 선호된다는 생각이 있지만 분명히 산술 평균 정밀도를 취하고 유용한 결과를 회수하고 출력 할 수 있습니다.
ilanman

우수한! 고조파 평균화 규칙을 사용하기위한 "정의"를 찾고 있습니다. 그러나 나는 정당화에 대해 어떻게 생각
해야할지 모르겠다

10

E[X]E[1/X]

f(x)=αx0αxα+1Ixx0
α1
E[1/X]=x0αx0αxα+2dx=αx0α(α+1)x0α+1=α(α+1)x0

Be(α,β)α1

또한 베이지안 후부 신분 기반으로 적분, 특히 정규화 상수에 대한 몬테카를로 근사와 관련이 있습니다.

E[φ(θ)π(θ)L(θ|x)|x]=1m(x)
φ()π()L(|x)m()

2
평균화 할 때 왜 이러한 특성이 선호됩니까?
마 고양이

나는 최적의 결과를 알지 못하지만 유한 한 기대치를 갖는 추정기를 갖는 것은없는 것보다 바람직합니다!
시안
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.