그것을 증명하는 방법


9

불평등을 설정하려고 노력했습니다

|Ti|=|XiX¯|Sn1n

어디 X¯ 표본 평균이고 S 표본 표준 편차, 즉 S=i=1n(XiX¯)2n1.

보기 쉽다 i=1nTi2=n1 그래서 |Ti|<n1그러나 이것은 내가 찾던 것에 가깝지 않으며 유용한 경계도 아닙니다. 나는 Cauchy-Schwarz와 삼각형 부등식을 실험했지만 아무데도 가지 않았습니다. 어딘가에 누락 된 미묘한 단계가 있어야합니다. 도움을 주셔서 감사합니다. 감사합니다.

답변:


10

이것은 Samuelson의 불평등이며 기호. 당신은 가지고가는 경우 위키 백과 버전 과 그것을 재 작업n1 의 정의 S, 당신은 그것이된다는 것을 알게 될 것입니다

|XiX¯|Sn1n

그것은 책에서 엄격한 불평등으로 주어졌지만 고맙습니다.
JohnK

5

일상적인 절차를 통해 문제를 단순화 한 후 문제를 기본적인 증거로 잘 알려진 이중 최소화 프로그램으로 변환하면 문제를 해결할 수 있습니다. 아마도이 이중화는 문제에서 언급 된 "미묘한 단계"일 것입니다. 불평등은 또한 최대화함으로써 순전히 기계적인 방식으로 확립 될 수있다|Ti| 라그랑주 승수 를 통해 .

우선, 나는 최소 제곱의 기하학을 기반으로보다 우아한 솔루션을 제공합니다. 사전 단순화가 필요하지 않으며 거의 ​​즉각적으로 결과에 직접적인 직관을 제공합니다. 이 질문에서 제안했듯이 문제는 Cauchy-Schwarz 불평등으로 줄어 듭니다.


기하학적 솔루션

치다 x=(X1,X2,,Xn)n점이있는 유클리드 공간의 3 차원 벡터 허락하다y=(0,0,,0,1,0,,0) ~이다 ith 기본 벡터와 1=(1,1,,1). 쓰다x^y^ 의 직교 투영을 위해 xy 직교 보체로 1. (통계적 용어로, 평균과 관련하여 잔차입니다.) 그런 다음XiX¯=x^yS=||x^||/n1,

|Ti|=n1|x^y|||x^||=n1|x^y^|||x^||

구성 요소입니다 y^ 에서 x^방향. Cauchy-Schwarz에 의해 정확하게 최대화됩니다x^ ~에 평행하다 y^=(1,1,,1,n1,1,1,,1)/n을 위해

Ti=±n1y^y^||y^||=±n1||y^||=±n1n,
QED.

또한이 솔루션은 모든 경우에 대한 철저한 특성을 제공합니다. |Ti| 최대화됩니다 : 그들은 모든 형태입니다

x=σy^+μ1=σ(1,1,,1,n1,1,1,,1)+μ(1,1,,1)

모든 진짜를 위해 μ,σ.

이 분석은 다음과 같은 경우에 쉽게 일반화됩니다. {1}모든 회귀 세트로 대체됩니다. 분명히 최대Ti 잔차 길이에 비례 y, ||y^||.


단순화

때문에 Ti 위치와 규모의 변화에 ​​따라 변하지 않으며, 일반성을 잃지 않고 Xi 합은 0이고 제곱은 n1. 이것은 식별|Ti||Xi|, 이후 S (평균 제곱)은 1. 그것을 극대화하는 것은 가장 중요하다|Ti|2=Ti2=Xi2. 복용으로 일반성이 손실되지 않습니다i=1, 이후 Xi 교환 할 수 있습니다.


통해 솔루션 이중 제형

이중 문제는 X12 남은 값을 물어보세요 Xj,j1제곱의 합 을 최소화 하는 데 필요합니다j=1nXj2 ~을 고려하면 j=1nXj=0. 때문에X1 이것이 최소화의 문제입니다 j=2nXj2 ~을 고려하면 j=2nXj=X1.

솔루션은 여러 가지 방법으로 쉽게 찾을 수 있습니다. 가장 기본적인 것 중 하나는 글을 쓰는 것입니다

Xj=X1n1+εj, j=2,3,,n

어떤 j=2nεj=0. 목적 함수를 확장하고이 합계 0 ID를 사용하여 생산을 단순화

j=2nXj2=j=2n(X1n1+εj)2=(X1n1)22X1n1εj+εj2=Constant+εj2,

독특한 솔루션을 즉시 보여줍니다 εj=0 모든 j. 이 솔루션의 경우

(n1)S2=X12+(n1)(X1n1)2=(1+1n1)X12=nn1X12

|Ti|=|X1|S=|X1|n(n1)2X12=n1n,

QED .


통해 솔루션기계

우리가 시작한 단순화 된 프로그램으로 돌아갑니다 :

Maximize X12

에 따라

i=1nXi=0 and i=1nXi2(n1)=0.

Lagrange multipliers (거의 순전히 기계적이고 간단하다)의 방법은이 세 함수의 기울기를 0에 대한 사소한 선형 조합과 같습니다.

(0,0,,0)=λ1D(X12)+λ2D(i=1nXi)+λ3D(i=1nXi2(n1)).

구성 요소 별 구성 요소 n 방정식은

0=2λ1X1+λ2+2λ3X10=λ2+2λ3X20=0=λ2+2λ3Xn.

마지막 n1 그들 중 하나를 암시 X2=X3==Xn=λ2/(2λ3) 또는 λ2=λ3=0. (우리는 후자의 경우를 배제 할 수 있습니다.λ1=0)를 0으로 합산하면 제약 조건이 생성됩니다. X1=(n1)X2. 제곱합 제약은 두 가지 솔루션을 제공합니다.

X1=±n1n; X2=X3==Xn=1n.

그들은 둘 다 생산

|Ti|=|X1||±n1n|=n1n.

부록에 감사드립니다. 지오메트리는 매우 강력하며 세 가지 솔루션 중 가장 직관적입니다.
JohnK

0

명시된 불평등은 사실이다. 불평등에 대한 가장 어려운 경우를 얻는다는 것은 직관적으로 분명합니다.S2) 하나의 값을 선택하여 x1다른 모든 것을 동일하게 유지하면서 가능한 한 큰. 이러한 구성의 예를 살펴 보겠습니다.

n=4,x1=x2=x3=0,x4=4,x¯=1,S2=4,
지금 |xix¯|S={12 or 32 에 따라 i주어진 상한은 412=1.5이것으로 충분합니다. 그 아이디어는 증거로 완성 될 수 있습니다.

편집하다

우리는 이제 위에서 암시 된 것처럼 주장을 증명할 것입니다. 먼저 주어진 벡터에 대해x=(x1,x2,,xn) 이 문제에서 우리는 그것을 xx¯불평등의 양쪽을 바꾸지 않고 따라서 다음에서는x¯=0. 또한 레이블을 재 라벨링하여x1가장 큽니다. 그런 다음 먼저 선택하여x1>0 그리고 x2=x3==xn=x1n1우리는 간단한 대수로 우리가 주장한 불평등에서 평등을 가지고 있는지 확인할 수 있습니다. 그래서 예리합니다.

그런 다음 (볼록한) 영역을 정의하십시오. R 으로

R={xR:x¯=0,(xix¯)2/(n1)S2}
주어진 양의 상수에 대해 S2. 참고R 원점을 중심으로 한 구와 초평면의 교차점이므로 구가 (n1)-우주. 우리의 문제는 이제
maxxRmaxi|xi|
이후 x그것을 극대화하는 것은 불평등의 가장 어려운 경우가 될 것입니다. 이것은 일반적으로 어려운 문제 (최소한 쉽다!) 인 볼록 세트에 대한 최대 볼록 함수를 찾는 문제입니다. 그러나이 경우 볼록 영역은 원점을 중심으로하는 구이며, 최대화하려는 함수는 좌표의 절대 값입니다. 최대가 경계 영역에서 발견된다는 것은 명백합니다R그리고 복용함으로써 |x1| 최대의 첫 번째 테스트 사례는 강제입니다.

지금 귀하의 의견을 삭제할 수 있습니다 @JohnK 포스트가 수정됩니다
할보 르센 kjetil B

이 응답을 보여줍니다 있지만 불평등이다 (이것은 어떤 그것이 사실이라고 가정) , 그 하나의 계산을 할 수 있는지 분명하지 않다 "증거에 완료." 어떻게해야하는지에 대한 정보를 제공해 주시겠습니까?
whuber

윌, 그러나 내일은 이제 내일 수업을 준비해야합니다.
kjetil b halvorsen

감사합니다. 문제를 신중하게 정리해 주셔서 감사합니다. 그러나 당신의 "증거"는 "명백하다"고 진술하는 것 같습니다. 항상 Lagrange 멀티 플라이어를 적용하여 작업을 완료 할 수 있지만 (a) 실제로는 증거이며 (b) 통찰력을 제공하는 접근 방식을 보는 것이 좋습니다.
whuber

2
@ whuber 시간이 있다면 Lagrange multipliers 솔루션을 게시 할 수 있다면 감사하겠습니다. 나는 불평등이 전체적으로 유명하지 않다고 생각한다.
JohnK
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.