Taylor 시리즈 (특히 나머지)에 대한 기대


42

내 질문은 널리 사용되는 방법, 즉 Taylor Series의 예상 가치를 취하는 방법을 정당화하려는 것입니다. 양의 평균 및 분산 인 임의의 변수 가 있다고 가정합니다 . 또한 와 같은 함수가 있습니다 .Xμσ2log(x)

평균 주위에서 확장하면 여기서 평소와 같이 는 st.logX

logX=logμ+Xμμ12(Xμ)2μ2+13(Xμ)3ξX3,
ξX|ξXμ|<|Xμ|

우리가 기대를한다면, 사람들은 일반적으로 자기-명백한 것으로 지칭하는 대략적인 방정식을 얻게 될 것입니다 ( 여기서 첫 번째 방정식 의 근사 부호 참조 ) :

ElogXlogμ12σ2μ2

질문 : 나머지 항의 예상 값이 실제로 무시할 수 있음을 증명하는 방법에 관심이 있습니다. 즉, (즉, ).

E[(Xμ)3ξX3]=o(σ2)
E[o(Xμ)2]=o(E[(Xμ)2])

내가 시도한 것 : (차례로 에서 의미 함 )을 가정하면, 를 -viinity N_ \ varepsilon : \ int_ \ mathbb {R} p (x) \ frac {(x- \ mu) ^ 3} {\ xi_x ^ 3} \, dx = \ int_ {x \ in N_ \ varepsilon} \ ldots dx + \ int_ {x \ notin N_ \ varepsilon} \ ldots dx σ20XμPμεNε

Rp(x)(xμ)3ξx3dx=xNεdx+xNεdx

첫 번째 것은 0Nε1/ξ3 가 귀찮게하지 않기 때문에 제한 될 수 있습니다 . 그러나 두 번째 것에는 두 가지 상충되는 사실이 있습니다. 한편으로는

P(|Xμ|>ε)0
( σ20 ). 그러나 다른 한편으로, 우리는 1 / \ xi ^ 3으로 무엇을해야할지 모른다 1/ξ3.

또 다른 가능성은 Fatou의 이름을 사용하려고 시도 할 수 있지만 방법을 알 수는 없습니다.

도움이나 힌트를 주셔서 감사합니다. 나는 이것이 일종의 매우 기술적 인 문제라는 것을 알고 있지만이 "테일러 기대"방법을 신뢰하기 위해서는 그것을 거쳐야합니다. 감사!

추신 : 나는 여기 에서 체크 아웃 했지만 조금 다른 것 같습니다.


Taylor 확장의 세 번째 용어 앞에 마이너스 부호가있는 이유는 무엇입니까? 또한 네 번째 학기에는 왜 3 아닌 3!? 내가 무엇을 놓치고 있습니까?
Alecos Papadopoulos

@Alecos : 의 번째 미분을 살펴보십시오 . 두 가지 질문에 모두 대답합니다. 로그 xnlogx
추기경

4
(+1)이 문제는 최근 의 순간을 찾는 것과 관련된 두 가지 질문에 대한 토론에서 나타났습니다 . 그러한 문제에 대해서는 추가적인주의를 기울여야합니다. :-)X1
추기경

1
평균값 정리로 인해 1 차 근사값이 실제로 더 나은 경우가 있습니다. 평균값 정리가 일반적인 경우에 도움이 될지 확실하지 않습니다.
확률

1
방정식 가 한계와 적분의 교환이므로 지배적 수렴 정리가 여기서 유용 할 것이라고 생각했을 것 입니다. E(o(..))=o(E(..))
확률

답변:


32

귀하는이 접근법에 회의적 일 권리가 있습니다. 휴리스틱에는 진실의 핵심이 포함되어 있지만 Taylor 시리즈 방법은 일반적으로 작동하지 않습니다 . 아래 기술 토론을 요약하면

  • 강한 집중력 은 Taylor 시리즈 방법이 훌륭한 기능을 수행한다는 것을 의미합니다
  • 헤비 테일 분포 또는 그리 좋지 않은 기능에는 상황이 크게 잘못 될 수 있습니다.

Alecos의 답변에서 알 수 있듯이 데이터에 꼬리가 많은 경우 Taylor 시리즈 방법을 폐기해야 함을 나타냅니다. (금융 전문가, 당신을보고 있습니다.)

Elvis가 지적했듯이 주요 문제는 분산이 더 높은 모멘트를 제어하지 않는다는 것 입니다. 이유를 알아 보려면 가능한 한 많이 질문을 단순화하여 기본 아이디어를 얻으십시오.

가정하면 , 우리는 임의의 변수들의 시퀀스를 와 으로서 . σ ( X N ) 0 N Xnσ(Xn)0n

Q : 을 로 보장 할 수 있습니까n ?E[|Xnμ|3]=o(σ2(Xn))n?

유한 한 두 번째 모멘트와 무한한 세 번째 모멘트를 갖는 임의의 변수 있기 때문에 답은 강조 되지 않습니다 . 따라서 일반적으로 Taylor 시리즈 방법은 3 차 다항식에서도 실패합니다 . 이 인수를 반복하면 임의 변수의 모든 모멘트가 잘 제어 되지 않으면 Taylor 시리즈 방법이 다항식에서도 정확한 결과를 제공 할 것으로 기대할 수 없습니다 .

그러면 어떻게해야합니까? 확실히이 방법은 지원이 점으로 수렴되는 경계 랜덤 변수에 대해 작동 하지만이 클래스는 너무 작아서 흥미로울 수 없습니다. 대신에 시퀀스 이 (예를 들어) 만족하는 일부 고집적 가정 에서 나온다고 가정하자.Xn

(1)P{|Xnμ|>t}eCnt2

모든 및 일부 . 이러한 임의의 변수는 놀라 울 정도로 일반적입니다. 예를 들어 이 경험적 평균 인 경우C > 0t>0C>0Xn

Xn:=1ni=1nYi

좋은 임의의 변수 (예를 들어, iid 및 경계)의 다양한 농도 불평등 은 (1)을 만족 한다는 것을 암시한다 . 표준 인수 ( 여기 10 페이지 참조 ) 는 이러한 임의 변수에 대한 번째 모멘트를 제한합니다 .X nYiXnp

E[|Xnμ|p](p2Cn)p/2.

따라서 "충분히 좋은"분석 함수 (아래 참조)에 대해 삼각형 부등식을 사용하여 term Taylor 계열 근사값 에서 오류 을 바인딩 할 수 있습니다.E의 mfEmm

Em:=|E[f(Xn)]p=0mf(p)(μ)p!E(Xnμ)p|1(2Cn)(m+1)/2p=m+1|f(p)(μ)|pp/2p!

때 . 스털링의 근사가 제공하기 때문에 , 잘린 Taylor 계열의 오류는 다음을 충족합니다.p ! p p - 1 / 2n>C/2p!pp1/2

(2)Em=O(n(m+1)/2) as nwheneverp=0p(1p)/2|f(p)(μ)|<.

따라서, 이 강하게 집중되고 가 충분히 좋은 경우, 테일러 계열 근사값은 실제로 정확합니다. (2)에 나타나는 불평등은 , 특히 우리의 조건에 따라 는 full 입니다. 이것은 (1)이 에 대한 경계 가정을 강요하지 않기 때문에 의미가 있습니다. F F ( P ) ( μ ) / P ! = O ( p p / 2 ) fXnff(p)(μ)/p!=O(pp/2)fXn

가 특이점을 가질 때 무엇이 ​​잘못 될 수 있는지 보자 (whuber의 의견에 따름). 선택한다고 가정 해 봅시다 . 0과 2 사이에서 잘린 분포 에서 을 취하면 은 충분히 집중되지만 모든 대해 입니다 . 다시 말해서, 우리는 고도로 집중된 경계 랜덤 변수를 가지고 있으며 함수가 단 하나의 특이점을 가질 때 여전히 Taylor 시리즈 방법은 실패합니다.f ( x ) = 1 / x X n N o r m a l ( 1 , 1 / n ) X n E [ f ( X n ) ] = nff(x)=1/xXnNormal(1,1/n)XnE[f(Xn)]=n

엄격한 몇 마디. 나는 엄격한 정리 / 증거 형식으로 요구 되는 deus ex machina 보다는 파생 된 것으로서 (2)에 나타나는 조건을 제시하는 것이 더 좋다는 것을 알게되었다. 논증을 완전히 엄격하게하기 위해 먼저 (2)의 오른쪽은 다음을 의미합니다.

E[|f(Xn)|]i=0|f(p)(μ)|p!E[|Xnμ|p]<

위에서 subgaussian 순간의 성장 속도에 의해. 따라서 후 비니의 정리는

E[f(Xn)]=i=0f(p)(μ)p!E[(Xnμ)p]

나머지 증명은 위와 같이 진행됩니다.


1
나는 빠른 독서에서 그것을 놓쳤을 수도 있지만, 의 세 번째 순간 이 충분히 "통제력" 을 제공했다면 (다른 것들 중에서) 주장하고 있습니까 ? 그런 다음 대한 기대는 [MacLaurin] 시리즈 ? 시리즈 자체의 수렴 속성에 대한 참조를 보지 못했기 때문에 걱정됩니다 분포의 꼬리만큼이나 중요합니다 . 로그 ( X ) 로그 XXlog(X)logX
whuber

2
@whuber 당신이 맞습니다; Taylor 시리즈의 ROC 에 를 지원해야합니다 . 특히 거의 확실합니다. 이를 반영하여 게시물을 업데이트하겠습니다. 0 < X < 2 μX0<X<2μ
Mike McCoy

2
나는 아직도 내가 뭔가를 놓치고 있다고 생각합니다. 예를 들어, 가 잘린 법선 분포를 가질 때 , 그것은 분명히 "고집 중"이고 평균은 이며 거의 확실하게 수렴 반경 내에 있습니다 ( 를 포함하는 중심으로하는 장치 디스크 내부에서 분석 중 ) 는 무한대입니다. ( 1 , 1 ) ( 0 , 2 ) μ = 1 F ( X ) = 1 / X = 1 / ( 1 - ( 1 - X ) ) 1 ( 0 , 2 μ ) E [ F ( X ) ]X(1,1)(0,2)μ=1f(x)=1/x=1/(1(1x))1(0,2μ)E[f(X)]
whuber

1
@gron 약간의 오류가 발생했습니다. 하면 미분 . 때문에 조건이 유지되지 않습니다 임의위한 . 임의의 기능을 만족 (2) 또한 만족 때문에 또한 (2)를 보유하지 않고 확인할 수 , 그러므로 가지고 특이점 없음 ( 링크 당 전체 ). | f ( p ) ( μ ) | = p ! / μ p (2) = p ! p ( 1 - p / 2 ) μ pμ > 0 log ( p ! f ( p ) ( μ ) ) / p ff(x)=1/x|f(p)(μ)|=p!/μp
(2)=p!p(1p/2)μp
μ>0log(p!f(p)(μ))/pf
Mike McCoy

1
당신은 두 가지가 필요합니다 @gron : (1) RV 엄격 로그의 멱급수의 ROC 내에서 지원이 있는지 확인합니다 (즉, 에 대한 ), 및 (2) 위의 대한 오차 추정치 가 유한 할 정도로 RV의 모멘트가 충분히 빠르게 감소하는지 확인하십시오 . 순간을 제어하는 ​​방법에 관해서는 너무 많은 문자가 필요하기 때문에 새로운 질문을해야합니다 (그리고 나는 새로운 방법에 대해 궁금합니다). ε > 0 E m[0+ε,2με]ε>0Em
Mike McCoy

10

내 답변은 다른 답변의 수학적 정교화 수준에 도달하지 않지만 결과는 "부정적"이지만 결과는 "부정적"이라고 생각하기 때문에 게시하기로 결정했습니다.

밝은 톤에서는 OP가 2 차 테일러 시리즈 확장 근사값이 "be"가되기에 충분한 조건이 필요하기 때문에 OP는 "위험 회피" (대부분의 사람들은 물론 과학 자체) 라고 말할 수 있습니다. 허용 " 그러나 필요한 조건 은 아닙니다 .

첫째, OP가 요구하는 것처럼 rv의 분산보다 Remainder의 예상 값이 차수보다 낮을 필요가 있지만 충분하지 않은 전제 조건은 시리즈가 처음에 수렴한다는 것입니다. 컨버전스를 가정해야합니까? 아니.

우리가 검사하는 일반적인 표현은

E[g(Y)]=fY(y)[i=0g(i)(μ)(yμ)ii!]dy[1]

마찬가지로 Loistl (1976) Gemignani의 "미적분과 통계"책 (1978, P. 170)을 참조하여 미국, 무한 합이 수렴하는 상태 (의 애플리케이션 인 비율 테스트 컨버전스는)

yμ<|yμ|<limi|(g(i)(μ)g(i+1)(μ)(i+1))|[2]

... 여기서 는 rv의 평균입니다. 이것도 충분한 조건이지만 (위의 관계가 동일하게 유지되는 경우 비율 테스트는 결정적이지 않습니다) 부등식이 다른 방향으로 유지되면 계열이 분기됩니다.μ

Loistl은 , 지수, 거듭 제곱 및 로그에 대한 세 가지 특정 기능 양식을 조사 했습니다 (그의 논문은 Expected Utility and Portfolio Choice의 분야에 있으므로 오목한 유틸리티 함수를 나타내는 데 사용되는 표준 기능 양식을 테스트했습니다). 이러한 기능적 형태의 경우, 지수 함수 적 형태에 대해서만 에 대한 제한이 없음을 발견했습니다 . 반대로, 거듭 제곱과 대수의 경우 (이미 ), 부등식의 유효성 는 g()yμ0<y[2]

yμ<μ0<y<2μ

즉, 변수가이 범위를 벗어나면 변수의 평균이 확장 중심이되는 Taylor 확장이 분산됩니다.

따라서 일부 기능 형태의 경우 도메인의 특정 지점에서 함수의 가치는 확장 지점에서 얼마나 멀리 떨어져 있든 무한한 Taylor 확장과 같습니다. 다른 기능적 형태 (대수 포함)의 경우, 관심 지점은 선택한 확장 중심에 다소 "가까워 야"합니다. 우리가 rv를 갖는 경우, 이것은 변수의 이론적 지원에 대한 제한 (또는 경험적으로 관찰 된 범위의 검사)으로 해석됩니다.

수치 예를 사용하는 Loitl은 또한 절단 전 확장 순서를 늘리면 근사값의 정확도가 더 나빠질 수 있음을 보여주었습니다 . 우리는 경험적으로 볼 때 금융 부문에서 관측 된 일련의 관측 변수가 불평등에 필요한 것보다 큰 변동성을 보인다는 점에 유의해야합니다. 그래서 Loitl은 포트폴리오 선택 이론과 관련하여 Taylor 시리즈 근사 방법론이 완전히 폐기되어야한다고 주장했습니다.

반등은 18 년 후 Hlawitschka (1994) 에서 나왔다 . 여기서 귀중한 통찰력과 결과는 다음과 같습니다.

... 시리즈가 궁극적으로 수렴 될 수 있지만, 일부 시리즈에 대해서는 거의 말할 수 없습니다. 시리즈의 수렴은 용어의 크기가 즉시 감소하거나 특정 용어가 무시하기에 충분히 작다는 것을 의미하지는 않습니다. 실제로, 여기에 설명 된 바와 같이, 시리즈가 궁극적으로 한계에 수렴하기 전에 분기되는 것처럼 보일 수 있습니다. 따라서 Taylor 계열의 처음 몇 항을 기반으로하는 예상 유틸리티에 대한 모멘트 품질 근사값은 무한 계열의 수렴 특성에 의해 결정될 수 없습니다. 이것은 경험적인 문제이며, 여기서 연구 된 유틸리티 기능에 대한 2 개의 모멘트 근사는 포트폴리오 선택 작업에 ​​적합합니다. 왈 리츠카 (1994)

예를 들어, Hlawitschka는 Taylor 계열이 수렴되는지 여부에 관계없이 2 차 근사치가 "성공"했음을 보여 주 었지만 Lotl의 결과도 확인했습니다. 그러나이 성공의 한정자가 있습니다. Portfolio Choice에서 Expected Utility는 유가 증권 및 기타 금융 상품의 순위매기 는 데 사용됩니다 . 추기경 이 아닌 서수 측정법입니다. 무엇 Hlawitschka 발견하면 2 차 근사이다 그래서 순위 보존 의 정확한 값에 따른 순위에 비해, 다른 유가 증권의 및 하지E(g(Y) 그것은 항상이 정확한 값에 충분히 근접한 양적 결과를 주었다 (718 페이지의 그의 표 A1 참조).

그래서 어디로 우리를 떠나? 림보에서 말하고 싶습니다. 이론과 경험적 측면에서 2 차 테일러 근사치의 수용 가능성은 연구중인 특정 현상과 사용 된 과학적 방법론의 여러 측면에 따라 결정적으로 좌우됩니다. 사용 된 기능적 형태에 따라 이론적 가정과 시리즈의 관측 된 변동성에 대해 ...

그러나 이것을 긍정적으로 끝내자. 요즘 컴퓨터 전원은 많은 것을 대신한다. 따라서 이론적 인 문제이든 경험적인 문제이든 관계없이 변수의 광범위한 값에 대해 2 차 근사의 유효성을 시뮬레이션하고 테스트 할 수 있습니다.


8

실제 답변은 아니지만 상황이 좋지 않다는 것을 보여주는 예 이며이 결과를 실현하려면 추가 가설이 필요합니다.

을 균일 한 와 일반 의 혼합으로 정의 , 균일 성분은 확률 으로 선택되고 정규 확률은 입니다. 당신은 과 그것의 분산 수렴 시 같이 무한대 착각하지 않으면 .XnU([1n;1n])N(nn1,1n)1n11n=n1nE(Xn)=10n

E(Xn2)=13n2×1n+((nn1)2+1n)×n1n,

이제 (및 )를 정의하십시오. 랜덤 변수 은 잘 정의되어 있지만 가 정의되지 않았으므로 예상 값 이 없습니다. 아무리 큰 이든지 상관 없습니다 .f(x)=1/xf(0)=0f(Xn)

1n1n1xdx
n

필자의 결론은 의 글로벌 거동에 대한 가설이 필요 하거나 예상 값에서 멀어지면 의 밀도가 감소 하는 속도에 대한 가설이 분명히 필요하다는 것 입니다. 나는 그러한 가설이 고전 문학 (그리고 심지어 교과서에서도)에서 발견 될 수 있다고 확신한다. 불행히도 나의 훈련은 통계에 없었고 나는 여전히 문헌 자체와 씨름하고있다.fXn

추신. 이 예는 Nick의 답변과 반대되는 예가 아닙니까? 그럼 누가 틀렸어?


1
당신의 인수의보다 일반적인 문이다 존재에 대한 유한E[Xk]k=1,2,3
probabilityislogic

위의 의견이 정확하지 않다고 생각합니다. 함수 는 지점에서 Taylor Series 확장을 허용한다는 것 입니다. 제공하는 예 에서 에서 연속적이지 않은 가 있습니다. 이것은 테일러 시리즈에서 를 확장 할 수 없다는 것을 의미한다고 생각합니다 . f(x)x=μf(x)=1xx=0f
probabilityislogic

일 수 있습니다 . 그러면 수렴 반경이 있습니다 ... 무한 수렴 반경이 필요할 수 있습니까?! 그것은 강력한 요구 사항입니다. μ=1
Elvis

1
엘비스, 우리는 세계적인 상태가 필요합니다. 본질적으로 나머지는 분포의 꼬리에 가중치를 부여한 후에 훌륭하게 작동해야합니다. 최근에 나온 예제와 비슷한 내용은 여기 , 여기여기를 참조 하십시오 .
추기경

4

이것은 완전한 답이 아니며, 2 차 근사에 도달하는 다른 방법 일뿐입니다.

나는 가야 할 가장 좋은 방법은 테일러 시리즈의 나머지 용어로 작업하기보다는 Cauchy의 평균 가치 정리를 사용하는 것입니다. 한 번 적용하면

f(X)=f(μ)+f(ξ1)(Xμ)

일부 때 또는 때 . 우리는 지금 다시 평균값의 정리를 적용 우리는이Xξ1μXμXξ1μXμf(ξ1)

f(ξ1)=f(μ)+f(ξ2)(ξ1μ)

일부 때 또는 때 . 이것을 첫 번째 fomula에 넣으면Xξ1ξ2μXμXξ1ξ2μXμ

f(X)=f(μ)+f(μ)(Xμ)+f(ξ2)(ξ1μ)(Xμ)

이 결과 는 가 연속적이고 와 두 배로 구별 할 있어야한다는 점에 유의하십시오 . 그러나 이것은 단지 고정 적용 및 변경 에 대응하는 변화를 의미한다 . 2 차 델타 방법은하기로 알 수있는 글로벌 가정 그 와 의 지지체의 전체 범위에 걸친 , 또는 적어도 높은 확률 질량의 영역에 걸쳐.X μ X X ξ i ξ 1μ =fXμXXξiξ2=μXξ1μ=12(Xμ)ξ2=μX

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.