몇 년 전에 나는 학생들 (스페인어)을 위해 이것에 관한 논문을 썼기 때문에 여기서 그 설명을 다시 쓰려고 노력할 수 있습니다. 복잡성을 증가시키는 일련의 예를 통해 IRLS (반복적으로 가중 된 최소 제곱)를 살펴 보겠습니다. 첫 번째 예에서는 위치 규모 제품군의 개념이 필요합니다. 하자 어떤 의미에서 제로를 중심으로 밀도 함수이다. 를 정의하여 밀도 계열을 구성 할 수 있습니다
여기서 되는 스케일 파라미터 f ( x ) = f ( x ; μ , σ ) = 1f0σ>0μf0N(μ,σ)
f(x)=f(x;μ,σ)=1σf0(x−μσ)
σ>0μ위치 매개 변수입니다. 일반적으로 오차 항이 정규 분포로 모델링되는 측정 오차 모델에서 정규 분포 대신 위와 같이 위치 스케일 패밀리를 사용할 수 있습니다. 경우 표준 정규 분포이며, 상기 구조가 제공 패밀리.
f0N(μ,σ)
이제 간단한 예제에서 IRLS를 사용하겠습니다. 먼저 모델
에서 밀도
ML (최대 가능성) 추정값을
Cauchy 분포는 위치 패밀리 (따라서 이는 위치 패밀리입니다). 그러나 먼저 몇 가지 표기법이 있습니다. 가중 최소 제곱 추정기 주어진다
여기서 는 가중치입니다. 우리는 의 ML 추정량이 와 같은 형식으로 표현 될 수 있음을 알 수 있습니다f ( y ) = 1
Y1,Y2,…,Yni.i.d
f(y)=1π11+(y−μ)2,y∈R,
μμμ∗=∑ni=1wiyi∑ni=1wi.
wiμwi잔차 의 일부 기능
우도 함수는
이고 로그 우도 함수는
대한 파생어 는
여기서 입니다. 쓰다
ϵi=yi−μ^.
L(y;μ)=(1π)n∏i=1n11+(yi−μ)2
l(y)=−nlog(π)−∑i=1nlog(1+(yi−μ)2).
μ∂l(y)∂μ===0−∑∂∂μlog(1+(yi−μ)2)−∑2(yi−μ)1+(yi−μ)2⋅(−1)∑2ϵi1+ϵ2i
ϵi=yi−μf0(ϵ)=1π11+ϵ2 및 이면
우리는 발견
우리의 정의를 사용
f′0(ϵ)=1π−1⋅2ϵ(1+ϵ2)2f′0(ϵ)f0(ϵ)=−1⋅2ϵ(1+ϵ2)211+ϵ2=−2ϵ1+ϵ2.
∂l(y)∂μ===−∑f′0(ϵi)f0(ϵi)−∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)⋅(−ϵi)∑wiϵi
wi=f′0(ϵi)f0(ϵi)⋅(−1ϵi)=−2ϵi1+ϵ2i⋅(−1ϵi)=21+ϵ2i.
것을 기억
우리가 식을 구하는
IRLS의 예측 식이다. 참고
ϵi=yi−μ∑wiyi=μ∑wi,
- 가중치 는 항상 양수입니다.wi
- 잔차가 크면 해당 관측치에 가중치가 적습니다.
실제로 ML 추정기를 계산하려면 시작 값 이 필요합니다. 예를 들어 중간 값을 사용할 수 있습니다. 이 값을 사용하여 잔차
및 가중치
의 새로운 값 주어진다
이런 식으로 계속해서 우리는
및
알고리즘
의 패스 에서의 추정값 은
μ^(0)
ϵ(0)i=yi−μ^(0)
w(0)i=21+ϵ(0)i.
μ^μ^(1)=∑w(0)iyi∑w(0)i.
ϵ(j)i=yi−μ^(j)
w(j)i=21+ϵ(j)i.
j+1μ^(j+1)=∑w(j)iyi∑w(j)i.
시퀀스
수렴 될 때까지 계속합니다.
μ^(0),μ^(1),…,μ^(j),…
이제 우리는보다 일반적인 위치 및 스케일 패밀리 로이 프로세스를 연구합니다 . 하자 위의 밀도 독립적. 도 정의하십시오 . 로그 우도 함수는
기록 , 참고
과
로그 우도 미분 계산
f(y)=1σf0(y−μσ)Y1,Y2,…,Ynϵi=yi−μσ
l(y)=−n2log(σ2)+∑log(f0(yi−μσ)).
ν=σ2∂ϵi∂μ=−1σ
∂ϵi∂ν=(yi−μ)(1ν−−√)′=(yi−μ)⋅−12σ3.
∂l(y)∂μ=∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂μ=∑f′0(ϵi)f0(ϵi)⋅(−1σ)=−1σ∑f′o(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)=1σ∑wiϵi
이고 이것을 0과 같으면 첫 번째 예와 동일한 추정식이 제공됩니다. 그런 다음 에 대한 추정기를 검색하십시오 .
σ2∂l(y)∂ν=====−n21ν+∑f′0(ϵi)f0(ϵi)⋅∂ϵi∂ν−n21ν+∑f′0(ϵi)f0(ϵi)⋅(−(yi−μ)2σ3)−n21ν−121σ2∑f′0(ϵi)f0(ϵi)⋅ϵi−n21ν−121ν∑f′0(ϵi)f0(ϵi)⋅(−1ϵi)(−ϵi)⋅ϵi−n21ν+121ν∑wiϵ2i=!0.
추정기
이 경우에도 위의 반복 알고리즘을 사용할 수 있습니다.
σ2^=1n∑wi(yi−μ^)2.
다음에서는 이중 지수 모델 (알려진 척도) 및 data에 대해 R을 사용하여 수치 예를 제공합니다 y <- c(-5,-1,0,1,5)
. 이 데이터의 경우 ML 추정기의 실제 값은 0입니다. 초기 값은입니다 mu <- 0.5
. 알고리즘의 한 단계는
iterest <- function(y, mu) {
w <- 1/abs(y-mu)
weighted.mean(y,w)
}
이 기능을 사용하면 "수동으로"반복을 수행하여 실험 할 수 있습니다. 그런 다음 반복 알고리즘을 사용하여 수행 할 수 있습니다.
mu_0 <- 0.5
repeat {mu <- iterest(y,mu_0)
if (abs(mu_0 - mu) < 0.000001) break
mu_0 <- mu }
연습 : 모형이 스케일 모수 분포 인 경우 반복은 가중치
연습 : 밀도가 로지스틱 인 경우 가중치가
tkσ승(ε)=1-Eε
wi=k+1k+ϵ2i.
w(ϵ)=1−eϵ1+eϵ⋅−1ϵ.
여기에 남겨 두는 동안이 게시물을 계속하겠습니다.