"평균"의 일부 일반화에 대한 중앙값은 평균의 유형입니까?


20

"평균"이라는 개념은 전통적인 산술 평균보다 훨씬 넓습니다. 중앙값을 포함하도록 확장됩니까? 유추하여

raw dataidraw datameanraw meanid1arithmetic meanraw datarecipreciprocalsmeanmean reciprocalrecip1harmonic meanraw dataloglogsmeanmean loglog1geometric meanraw datasquaresquaresmeanmean squaresquare1root mean squareraw datarankranksmeanmean rankrank1median

내가 그리는 유추는 다음과 같이 준 산술 평균 과 같습니다.

Mf(x1,,xn)=f1(1ni=1nf(xi))

비교를 위해 5 개 항목 데이터 집합의 중앙값이 세 번째 항목과 같다고 말할 때 1에서 5까지의 데이터 순위를 지정하는 것과 같습니다 (함수 f로 표시 될 수 있음 f). 변환 된 데이터의 평균을 취하는 것 (3 개); 순위가 3 인 데이터 항목 ( f1 ) 의 값을 다시 읽습니다 .

기하 평균, 고조파 평균 및 RMS의 예에서, f 는 임의의 수에 독립적으로 적용될 수있는 고정 함수입니다. 반대로 순위를 할당하거나 순위에서 원래 데이터로 되돌리려면 (필요한 경우 보간) 전체 데이터 세트에 대한 지식이 필요합니다. 또한 정의에서 준 산술 평균을 읽었으므로 f 는 연속적이어야합니다. 중앙값은 특별한 준 산술 평균의 경우로 간주 됩니까? 그렇다면 f 는 어떻게 f정의됩니까? 아니면 중앙값이 "평균"이라는 다른 더 넓은 개념의 실례로 묘사되어 있습니까? 준 산술 평균은 확실히 유일한 일반화가 아닙니다.

문제의 일부는 용어 적입니다 ( "중앙 경향"또는 "평균"과 달리 "평균"이란 무엇입니까?). 예를 들어 퍼지 제어 시스템 에 대한 문헌 에서 집계 함수 F:[a,b]×[a,b][a,b]에프(에이,에이)=에이F 와 함께 증가하는 함수입니다. (b, b) = b에프(,)= ; 모든 x, y \ in [a, b]에 대한 (엑스,와이)에프(엑스,와이)최대(엑스,와이) 를 "평균"이라고 하는 집계 함수 일반적인 의미). 말할 필요도없이 그러한 정의는 엄청나게 광범위합니다! 그리고이 맥락에서 중앙값은 실제로 평균의 유형이라고합니다. ^ {[1]}엑스,와이[에이,][1]그러나 평균의 덜 폭 넓은 특성화가 여전히 중앙값을 포함 할 정도로 충분히 확장 될 수 있는지 궁금합니다. 소위 일반화 된 평균 ( "파워 평균"으로 더 잘 설명 될 수 있음)과 Lehmer 평균은 그렇지 않습니다. . 가치있는 것을 위해, Wikipedia는 "다른 수단"목록에 "중앙값"을 포함 하지만 더 이상의 언급이나 인용은 없습니다.

[1] : 두 개 이상의 입력에 대해 적절하게 확장 된 이러한 평균의 광범위한 정의는 퍼지 제어 분야에서 표준으로 보이며, 중간 값으로 설명되는 중간 값의 인스턴스를 인터넷 검색 중에 여러 번 자릅니다. 예를 들어 Fodor, JC, & Rudas, IJ (2009), "이동하는 일부 집계 함수 클래스 ", IFSA / EUSFLAT Conf. (pp. 653-656). 덧붙여,이 종이 노트 용어 "평균"(의 초기 사용자 중 한 것을 moyenne가 )이었다 코시 에있는 쿠르 디부 분석 드 난 에콜 폴리 테크닉 대학 로얄, 1ère partie; 대수학 (1821)을 분석합니다 . 의 최신 기여 Aczél , Chisini ,Finetti 드 코시보다 "평균"의 일반적인 개념을 개발 "는 포더, J., 및 Roubens, M. (1995)에서 인정 수단의 유의성에 " 전산 응용 수학의 학회지 , 64 (1) 103-115.


나는 산술 평균, 중간 및 모드 광석이 일반적으로 종종 "평균"이라고 불리며 단어는 때때로 모호한 방식으로 사용된다고 생각합니다. 통계와 함께 거짓말하는 법 책은 통계와 함께 "거짓말"의 예로 사용합니다. (귀하의 질문이 더 일반적이라는 것을 알고 의견으로 게시하십시오.)
Tim

@Tim "모드"가 "평균"으로 표시되는 경우가 드물다는 비과학적인 인상을 받았습니다. 그러나 "평균"(때로는 "산술 평균"의 동의어로 사용되며 다른 경우에는 전혀 의미가없는 중심 경향의 측정 값 포함)과 "평균"( " 기술적 의미가 아닌 일반적인 사용은 대부분 "산술 평균"에 독점적으로 사용되지는 않습니다). 또한 "평균" 의 다른 의미 로 인해 인터넷 검색에도 어려운 주제입니다 !
Silverfish

3
평균 (산술, 기하, 조화, 전력, 지수, 조합 등)은 "분석 평균"입니다. 중앙값, 분위수, 탄젠트는 "위치 평균"입니다. 순위는 로그, 제곱 등과는 매우 다릅니다. 왜냐하면 임의의 변형이 균일 한 변형으로 단조 변환이므로 변형되지 않는 역 경로가 없기 때문입니다.
ttnphns

"일반화 된 평균"이라는 용어는
사전에 enocwikiied

3
계산 에서 가중치를 허용 하면 중간 값을 일종의 평균으로 쉽게 간주 할 수 있습니다. 마찬가지로, 동일하지는 않지만, 다듬어 진 수단의 개념은 중간 또는 제한적인 특별 사례로 포함됩니다. stata-journal.com/article.html?article=st0313 은 상당히 최근의 리뷰 중 하나입니다. 나는나는엑스나는,나는나는=1
Nick Cox

답변:


9

다음 은 중간 값을 "일반적인 종류의 평균"으로 간주 할 수있는 한 가지 방법입니다. 먼저 순서 통계 측면에서 일반적인 산술 평균을 신중하게 정의하십시오.

엑스¯=나는나는엑스(나는),나는=1.

그런 다음 일반적인 평균 주문 통계를 다른 가중치 함수로 바꾸면 주문을 설명하는 "일반 평균"이라는 개념을 얻게됩니다.

이 경우, 수많은 잠재적 센터 수단이 "일반화 된 수단"이됩니다. 중간 값의 경우 홀수 경우 이고 다른 모든 값은 0이고 경우 에도 .w ( n + 1 ) / 2 = 1 n w n(+1)/2=12=2+1=12

마찬가지로 M-estimation을 보면 위치 추정값은 산술 평균의 일반화로 간주 될 수도 있습니다 (평균의 경우 는 2 차, 는 선형 또는 가중치 함수는 평평함). 중앙값 또한이 일반화 범주에 속합니다. 이것은 이전의 것과는 다소 다른 일반화입니다.ψρψ

중앙값을 포함 할 수있는 '평균'개념을 확장 할 수있는 다양한 방법이 있습니다.


이거 좋은데. 이 답변과 밀접한 관련이 있으며 질문에 인용 된 논문에서 논의됩니다 : 순서 가중 평균 또는 OWA
Silverfish

11

평균을 2 차 손실 함수 SSE를 최소화하는 포인트로 생각하면 중앙값은 선형 손실 함수 MAD를 최소화하는 포인트이고 모드는 0-1 손실 함수를 최소화하는 포인트입니다. 변환이 필요하지 않습니다.

중앙값은 Fréchet 평균 의 한 예입니다 .


3
앤더슨 @ 마이크 : 음, 미디어가 Frechet의 의미가 있음이 쇼 (위키 피디 문서 참조) en.wikipedia.org/wiki/Fr%C3%A9chet_mean를
할보 kjetil B

@Kjetil 우수! 중앙값이 프레 케트 (Fréchet) 평균의 예라는 사실은 나의 질문에 대한 답이다. 그리고 마이크 앤더슨에게 +1. 이 정보가 답변으로 편집되기를 바랍니다.
Silverfish

2
답변에 @Kjetil의 의견을 추가하여 "Frechet mean"에 대한 사이트 검색에 표시됩니다. 둘 다 고마워
Silverfish

4

하나 쉽지만 결실 일반화이다 가중 수단 , 여기서 . 분명히 공통 또는 정원 평균은 가중치가 가장 간단한 특수 사례입니다 .n i = 1나는=1나는엑스나는/나는=1나는,w i = 1 / n나는=1나는=1나는=1/

가중치가 가장 작은 값에서 가장 큰 값의 순서에 따라 다른 특수한 경우, 특히 다른 이름으로도 알려진 잘린 평균에 대한 아이디어를 가리 킵니다 .

필요하지 않거나 특히 도움이되지 않는 곳에 표기법을 과도하게 사용하지 않으려면 가장 작은 값과 가장 큰 값을 무시하고 다른 값의 (균등 한 가중치) 평균을 취하는 것을 상상해보십시오. 또는 가장 작은 두 개와 가장 큰 두 개를 무시하고 다른 것의 평균을 취하는 것을 상상해보십시오. 기타 등등. 가장 활발한 트리밍 값의 수가 자연스럽게 단지 잘 알고있는, 홀수 또는 짝수인지에 따라 순서대로 모든하지만 하나 또는 두 개의 중간 값을 무시합니다 중간 . 트리밍 아이디어에서는 샘플의 각 꼬리에서 동일한 숫자를 무시할 수 없지만 비대칭 트리밍에 대해 더 많이 말하면이 스레드의 주요 아이디어에서 더 멀어 질 것입니다.

요컨대, 평균 (정규화되지 않은)과 중앙값은 (대칭) 트림 된 수단의 극한의 경우입니다. 전반적인 아이디어는 데이터의 모든 정보를 사용하는 이상과 극단적 인 데이터 포인트로부터 자신을 보호하는 또 다른 이상 사이의 절충을 허용하는 것입니다.

상당히 최근의 검토에 대해서는 여기참조하십시오 .


4

이 질문은 "평균"의 개념을 충분히 넓은 의미로 특성화하여 권력 수단, 평균, 중간 값, 트림 된 수단과 같은 모든 일반적인 수단을 포괄 하지만 데이터에 거의 쓸모가 없게되는 것은 아닙니다. 분석. 이 답변은 "평균"에 대한 합리적으로 유용한 정의가 가져야하는 공리적 특성 중 일부에 대해 논의합니다.


기본 공리

데이터 분석의 목적을 위해 "평균"에 유용하게 확장 정의는 잘 정의 된, 결정적 함수 중 어느 시퀀스 것 위한 와 그런A R n = 1 , 2 , 에프:에이에이에이아르 자형=1,2,

(1) 모든 (평균은 극단 사이에 있음),x = ( x 1 , x 2 , (엑스)에프(엑스)최대(엑스)엑스=(엑스1,엑스2,,엑스)에이

(2) 은 인수의 순열에 따라 변하지 않으며 (데이터의 순서에 신경 쓰지 않음을 의미)에프

(3) 각 은 각 인수에서 감소하지 않습니다 (숫자가 증가하면 평균이 감소 할 수 없음).에프

우리는 해야한다 허용 기하학적 수단으로 수단의 많음이, 그러한 부분 집합에 정의되어 있기 때문에 (예 : 모든 양수 등) 실수의 부분 집합이 될 수 있습니다.에이

우리는 또한 그것을 추가하고 싶을 수도 있습니다.

(1 ') 대한 적어도 가 존재합니다 . (이것이 항상 유지 되도록 요구할 수는 없습니다 . 예를 들어, 의 중앙값 은 과 같 으며 이는 최소값입니다.)최소 ( x ) f n ( x ) 최대 ( x ) ( 0 , 0 , , 0 , 1 ) 0엑스에이(엑스)에프(엑스)최대(엑스)(0,0,,0,1)0

이러한 속성은 일련의 (정렬되지 않은) 데이터의 일종의 "중간 값"인 "평균"뒤에있는 아이디어를 포착하는 것 같습니다.

일관성 공리

나는 다소 덜 분명한 일관성 기준 을 규정하고 싶다.

(4.A)의 범위 로 시간 간격에 걸쳐 변화 포함 . 즉, 적절한 값 를 데이터 세트 에 인접시켜 평균을 변경하지 않은 채로 둘 수 있습니다 . (3)과 함께, 데이터 세트에 극단 값을 인접 시키면 평균을 극단으로 끌어 올릴 수 있습니다.t [ ( X ) , 맥스 ( X가 ) ] f를 N ( X )에프+1(,엑스1,엑스2,,엑스)[(엑스),최대(엑스)]에프(엑스)

분포 또는 "무한 모집단" 에 평균 개념을 적용하려면 임의로 큰 임의 표본의 한계에서이를 구하는 것이 한 가지 방법입니다. 물론 한계가 항상 존재하지 않을 수도 있습니다 (예를 들어 분포에 기대치가없는 경우 산술 평균에는 존재하지 않음). 따라서 나는 그러한 한계의 존재를 보장하기 위해 추가 공리를 강요하고 싶지 않지만 다음은 자연스럽고 유용하게 보입니다.

(4.b) 가 묶이고 이 에서 지원되는 분포 의 샘플 시퀀스 일 때, 의 한계는 거의 확실합니다. 이렇게하면 표본 크기가 커짐에도 불구 하고 평균이 내에서 영원히 "튀는"것을 방지합니다 .x n F A f n ( x n에이엑스에프에이A에프(엑스)에이

같은 선을 따라 표본 크기가 증가함에 따라 "위치"를 더 잘 추정 할 수 있도록 평균에 대한 아이디어를 더욱 좁힐 수 있습니다.

(4.c) 가 경계 될 때마다 무작위 표본 대한 의 표본 분포 분포의 분산 의 의 비 감소되는 .f n ( X ( n ) ) X ( n ) = ( X 1 , X 2 , , X n ) F에이에프(엑스())엑스()=(엑스1,엑스2,,엑스)에프

연속성 공리

데이터에 따라 "멋지게"변화하는 수단을 요구할 수 있습니다.

(5) 은 각 인수에서 개별적으로 연속적입니다 (데이터 값의 작은 변화가 평균의 급격한 증가를 유발해서는 안 됨).에프

이 요구 사항은 이상한 일반화를 제거 할 수 있지만 잘 알려진 의미를 배제하지는 않습니다. 일부 집계 함수를 배제합니다.

불변성 공리

구간 또는 비율 데이터 (스티븐스의 잘 알려진 의미)에 적용하는 수단을 생각할 수 있습니다 . 우리는 위치 변화에 따라 변하지 않을 것을 요구할 수는 없지만 (기하학적 평균은 아닙니다) 요구할 수 있습니다

(6) 모든 및 모든 에 대해 입니다. 이것은 우리가 좋아하는 측정 단위를 사용하여 을 자유롭게 계산할 수 있다고 말합니다 .xA n λ > 0 λ xA n에프(λ엑스)=λ에프(엑스)엑스에이λ>0λ엑스에이에프

질문에 언급 된 모든 수단은 일부 집계 함수를 제외 하고이 공리를 충족시킵니다.


토론

질문에 설명 된 일반 집계 함수 는 반드시 공리 (1 '), (2), (3), (5) 또는 (6)을 만족 하지는 않습니다 . 일관성 공리를 만족시키는 지 여부는 로 확장되는 방법에 따라 달라질 수 있습니다 .에프2>2

일반적인 샘플 중간 값은 이러한 모든 공리 특성을 향유합니다.

일관성 공리를 보강하여

(4.d) 모든 대해xA n 입니다.에프2(엑스;엑스)=에프(엑스)엑스에이.

이는 데이터 세트의 모든 요소가 동일하게 반복 될 때 평균이 변하지 않음을 의미합니다. 그러나 이것은 너무 강할 수 있습니다. Winsorized 평균 에는이 속성이 없습니다 ( 무증상 제외). 상기의 목적 Winsorizing 수준에 대해 저항의 변화를 제공하는 적어도 데이터 중 극단. 예를 들어, 10 %의 평균 Winsorized 의 산술 평균이다 , 동일한 하지만, 10 %의 평균 Winsorized 은 입니다.100 α % ( 1 , 2 , 3 , 6 ) ( 2 , 2 , 3 , 3 ) 2.5 ( 1 , 1 , 2 , 2 , 3 , 3 , 6 , 6 ) 3.5100α% 100α%(1,2,,6)(2,2,,)2.5(1,1,2,2,,,6,6)3.5

일관성 공리 (4.a), (4.b) 또는 (4.c) 중 어느 것이 가장 바람직하거나 유용한 지 모르겠습니다. 그것들은 독립적 인 것처럼 보입니다 : 나는 그들 중 어떤 것도 세 번째를 암시한다고 생각하지 않습니다.


(+1) "1 ')은"평균은 극한이 아니라 "고 흥미로운 점이라고 생각합니다. 평균에 대한 다른 많은 자연적 정의에는 특별한 경우 나 제한적인 경우로서 최소값과 최대 값이 포함됩니다. 이는 전력 수단 , Lehmer 평균 , Fréchet 평균 , Chisini 평균Stolarsky 평균에 해당 됩니다. 그것들을 "평균"이라고 말하는 것은 조금 이상해 보이지만!
Silverfish 2019

예, 제한적인 경우는 피할 수 없습니다. 그러나 유한 한 데이터 세트의 경우 최대 값과 최소값 모두가 "평균"으로 규정되지 않아야합니다.
whuber

다른 한편으로, "일반적인 샘플 중앙값이 이러한 모든 공리적 특성을 즐긴다"는 것이 사실 일뿐만 아니라 일반적인 샘플 양자화도 수행합니다 (내가 무언가를 놓친 경우가 아니면). 또한 예를 들어 상위 사 분위수를 "평균"이라고 부르는 것은 조금 이상합니다. (왜냐하면 그것이 매우 치우친 데이터의 중심 경향의 척도로 사용 된 것을 보았지만). 우리가 다른 모든 Quantile을 받아들이면, 더 이상 최소값과 최대 값을 인정하는 것이 그리 이상하지 않습니다. 그러나 나는 적어도 그것들을 배제 할 권리를 유지하는 것이 바람직 할 수 있음을 알 수있다.
Silverfish 2019

1
나는 수단의 판테온에 Quantile을 허용함으로써 혼란스럽지 않습니다. 결국, 주어진 분포 군에 대해, 특정 비 중간 양자 값은 산술 수단과 일치하므로이 가능성을 공리적으로 제거하려고하면 문제가 발생할 수 있습니다. (예를 들어, 일정한 기하 SD의 대수 정규 분포 계열을 고려하십시오.) 산술 평균이 평균으로 적합하지 않으면 모든 것이 손실됩니다!
whuber

1
나는 그 대답에 설명 된 것처럼 그 접근 방식을 고려하고 거부했습니다 대해 그러한 기준을 적용 하면 평균의 형태로 중앙값을 제거합니다! >2
whuber

2

나는 중앙값이 산술 평균의 일반화의 한 유형으로 간주 될 수 있다고 생각합니다. 구체적으로, 산술 평균과 중앙값 (다른 것들 중에서)은 Chisini 평균 의 특별한 경우로 통합 될 수 있습니다. 값 집합에 대해 일부 작업을 수행하려는 경우 Chisini 평균은 집합의 모든 원래 값을 대체하고 여전히 동일한 결과를 얻을 수있는 숫자입니다. 예를 들어 값을 합산하려는 경우 모든 값을 산술 평균으로 바꾸면 같은 합이 산출됩니다. 아이디어는 특정 값이 해당 숫자에 대한 특정 연산의 맥락에서 세트의 숫자를 대표한다는 것입니다. (이러한 사고 방식의 흥미로운 의미는 주어진 값 (산술 평균)이 해당 숫자로 특정 작업을 수행한다는 가정 하에서 만 대표적으로 간주 될 수 있다는 것입니다.)

이것은 중앙값에 대해서는 덜 분명합니다 (그리고 중앙값이 Wolfram 또는 Wikipedia 에 대한 Chisini 수단 중 하나로 나열되지 않음에 유의하십시오 ).


이것은 매우 흥미로운 제안입니다. 중간 대해 갖도록 적절한 연산을 제안 할 수 있습니까? F ( M , M , . . . , M ) = F ( X 1 , X 2 , . . . , X의 N )에프(,,...,)=에프(엑스1,엑스2,...,엑스)
Silverfish

좋은 질문입니다, @Silverfish, 나는 그것에 대해 생각하고 있습니다 ;-). 내 생각은 당신의 Q & 의견 토론에서 개념적 프레임 워크는 평균을 얻는 방법과 평균에서 데이터를 얻는 방법입니다. OTOH, 내 프레이밍은 우리가 다음과 같은 의미를 사용하는 것입니다.
gung-Monica Monica 복원

나는 이것을 포함하여 더 광범위한 개념적 프레임 워크를 보여주는 질문에 인용을 추가했습니다. 현재 나는 "중앙을 잡는 것"보다 더 나은 볼 수 없다 . 에프
Silverfish 2019

@ Silverfish, 나는 내 입장에서 다소 문제가있는 구멍처럼 보입니다.
gung-복직 모니카

Chisini의 설정에서 얻은 통찰력은 예를 들어 산술 평균은 합계를 유지하지만 기하학적 평균은 제품을 유지하지만 산술 평균 도 입니다. 그래서 나는 그것이 치명적인 타격이라고 확신하지 않습니다. ˉ X(엑스¯,엑스¯,...,엑스¯)엑스¯
Silverfish

-1

질문이 잘 정의되어 있지 않습니다. n을 n으로 나눈 값의 합으로 평균에 대한 일반적인 "거리"정의에 동의하면, 우리는지면에 지분이 있습니다. 또한 중심 경향의 척도를 살펴보면 평균과 중간 값이 모두 발생은 아니지만 서로의 실현이라고 말할 수 있습니다. 내 배경의 일부는 비모수 적 인 것이므로 중간 값과 견고성, 단조로운 변형에 대한 불변 등을 좋아합니다. 그러나 각 측정 값은 목표에 따라 위치합니다.


2
우리 사이트, 밥에 오신 것을 환영합니다. 나는 당신이 질문의 끝까지, 특히 긴 두 번째 단락을 읽으면 그것이 정확하고 잘 정의되어 있음을 알게 될 것입니다. (그렇지 않으면 것은, 무슨 설명하는 좋은 아이디어가 될 것입니다 당신이 잘 정의되지 "에 의해 의미한다.) 여러분의 의견은 정말 요구되는 내용 주소로하지 않는 것.
whuber

1
나는 실제로 "의미"라는 개념이 단일 정의를 갖지 않는다는 의미에서 그 질문이 굉장히 잘 정의되어 있지 않다는 Bob의 생각에 공감하지만, 가능한 한 명확하게하기 위해 최선을 다했습니다. 가장 최근의 수정 사항이 내용을 명확하게하는 데 도움이되기를 바랍니다.
Silverfish

1
질문에 단순한 용어 이외의 다른 가치가 있다고 생각하는 이유는 (어쨌든 의미는 무엇이며, 중앙값을 포함하는 한 확장 할 수있는 정의가 있습니까?) 중앙값을 단 하나의 것으로 보는 것이 도움이 될 수 있기 때문입니다. 평균의 일반화 군의 일원; 닉 콕스 (Tick Cox)의 트림 된 평균의 제한 사례로서의 중앙값에 대한 예는 특히 훌륭합니다. 이는 원하는 "견고성"속성과 깔끔하게 연결되어 있습니다. 다듬은 수단의 패밀리에서 "거리"산술 평균과 중간 값은 그 사이의 스펙트럼과 반대쪽 끝에 있습니다.
Silverfish
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.