답변:
다변량 중앙값에 대해 하나의 허용 된 정의가 있는지 확실하지 않습니다. 내가 친숙한 것은 Oja의 중앙값 점으로 , 점의 하위 집합에 형성된 단순화 된 볼륨의 합계를 최소화합니다. (기술 정의에 대한 링크를 참조하십시오.)
업데이트 : 위의 Oja 정의를 참조하는 사이트에는 다변량 중앙값에 대한 여러 가지 정의를 다루는 훌륭한 문서가 있습니다.
으로 @Ars가 말했다에는이 정의를 받아들이지 않습니다 (이 좋은 포인트입니다)된다. 에서 Quantile을 일반화하는 방법의 일반적인 대안이 있습니다. 가장 중요한 것은 다음과 같습니다.
양자화 과정의 일반화 경험적 척도 (= A 의 관측치 비율 ) 로하자. 그런 다음에의 보렐 세트의 잘 선택된 부분 집합 R의 개발 및 λ 진정한 가치 측정, 당신은 경험 분위수 기능을 정의 할 수 있습니다 :
최소값을 제공하는 하나의 를 찾을 수 있다고 가정하십시오 . 그런 다음 집합 (또는 집합의 요소) 은 이 충분히 작을 때 중앙값을 제공합니다 . 및 사용하면 중앙값 정의가 복구됩니다 . Ars 답변은 그 프레임 워크에 속한다고 생각합니다 ... tukey의 반 공간 위치 는 및 ( , ).1 / 2 - ε ∩ 1 / 2 + ε ε = ( ] - ∞ , X ] X ∈ R ) λ ( ] - ∞ , X ] ) = X ( ) = ( H (X) = ( t ∈ R d :λ ( H X ) = X X ∈ R ∈ R D
변형 정의 및 M- 추정 여기서의 아이디어는에서랜덤 변수의 -quantile는 변형 등식을 통해 정의 될 수 있다는 것입니다.Q α Y R
가장 일반적인 정의는 Quantile 회귀 함수 (핀볼 손실이라고도 함)를 사용하는 것입니다. . 케이스 범@Srikant Answer 에서처럼 거리를 사용하여 더 높은 차원으로 일반화 할 수 있습니다 . 이것은 이론적 중앙값이지만 기대 값을 경험적 기대 값 (평균)으로 바꾸면 경험적 중간 값을 제공합니다. Q α = R g INF X ∈ R E [ ρ α ( Y - X ) ] α = 1 / 2 ρ 1 / 2 ( Y ) = | y | 패 1
그러나 Kolshinskii 는 Legendre-Fenchel 변환 사용을 제안합니다. since 여기서 대한 . 그는 그것에 대해 많은 깊은 이유를 제시합니다 (논문 참조). 더 높은 차원에이를 일반화하는 것은의 vectorial 작업이 필요합니다 및 교체 에 의해 하지만 당신이 취할 수있는 .
분명히 다른 제형 사이에 다리가 있습니다. 그들은 모두 명백하지 않습니다 ...
중간 개념을 더 높은 차원으로 일반화하는 뚜렷한 방법이 있습니다. 아직 언급되지 않았지만 오래 전에 제안 된 것 중 하나는 볼록 껍질을 만들고 껍질을 벗기고 가능한 한 반복하는 것입니다. 마지막 선체에 남은 것은 모두 후보가되는 점입니다. 중간 값. "
"헤드 뱅잉 (head-banging)" 은 2D 포인트 클라우드에 대한 강력한 중심을 구축하려는 또 다른 최근 시도 (1980 년)입니다. (링크는 미국 국립 암 연구소 (National Cancer Institute)에서 제공되는 설명서 및 소프트웨어에 대한 링크입니다.)
여러 가지 일반화가 있고 명백한 해결책이없는 주된 이유는 R1을 주문할 수 있지만 R2, R3, ...은 주문할 수 없기 때문입니다.
기하 중앙값 은 샘플과의 평균 유클리드 거리가 가장 작은 지점입니다.
그러한 정의가 존재하는지 모르겠지만 중간 값 의 표준 정의 를 확장하려고 시도 할 것 입니다. 다음 표기법을 사용합니다.
, Y : 2 차원과 관련된 랜덤 변수.
, m y : 해당 중앙값.
: 랜덤 변수의 합동 pdf
중간 값의 정의를 확장 하기 위해 다음을 최소화하기 위해 m x 및 m y 를 선택합니다 .
문제는 이제 우리가 의미하는 바에 대한 정의가 필요하다는 것입니다.
위의 의미는 거리 측정법이며 몇 가지 가능한 후보 정의가 가능합니다.
유클리드 메트릭에서 중앙값을 계산하려면 관절 밀도 에 대한 위의 예상 값을 계산해야합니다 .
택시 메트릭스의 경우 중앙값을 계산 하려면 메트릭이 x 와 y로 분리 가능하므로 와 Y 의 중간 값을 별도로 계산해야합니다 .