Tikhonov 정규화는 Ridge Regression과 동일합니까?


답변:


46

Tikhonov 정규화는 능선 회귀보다 더 큽니다. 여기 그들이 어떻게 다른지 정확히 설명하려고 시도했습니다.

알려진 행렬 와 벡터 에 대해 과 같이 벡터 를 찾고 싶다고 가정합니다 .B xAbx

Ax=b 입니다.

표준 접근법은 보통 최소 제곱 선형 회귀입니다. 그러나, 가 방정식을 만족 하지 않거나 하나 이상의 가 (즉, 해가 독특하지 않은 경우) 문제가 발생한다고합니다. 보통 최소 제곱은 다음과 같이 간단히 쓸 수있는 제곱 잔차의 합을 최소화하려고합니다.xxx

Axb2

여기서 유클리드 표준입니다. 행렬 표기법에서 \ hat {x} 로 표시된 솔루션 x^은 다음과 같이 제공됩니다.

x^=(ATA)1ATb

Tikhonov 정규화 최소화

Axb2+Γx2

적절하게 선택된 Tikhonov 매트릭스 . 로 표시된 명시 적 매트릭스 양식 솔루션 은 다음과 같습니다.XΓx^

x^=(ATA+ΓTΓ)1ATb

정규화의 효과는 matrix 의 스케일을 통해 달라질 수 있습니다 . 들면 이 (A 것을 제공 unregularized 최소 제곱 해를 줄 T A)가 -1 이 존재한다.Γ = 0ΓΓ=0

일반적 용 리지 회귀 , 노프의 정규화 두 출발 설명한다. 먼저 Tikhonov 매트릭스는 여러 개의 ID 매트릭스로 대체됩니다.

Γ=αI ,

더 작은 규범, 즉 규범을 가진 솔루션을 선호합니다 . 그런 다음 는 됩니다.Γ T Γ α 2 IL2ΓTΓα2I

x^=(ATA+α2I)1ATb

마지막으로, 능형 회귀 분석의 경우 일반적으로 가 상관 행렬 형식을 갖도록 변수의 크기가 조정 된다고 가정합니다 . 및 사이의 상관 벡터 인 변수 선도X T X X T b x bAXTXXTbxb

x^=(XTX+α2I)1XTb

이 형식에서 Lagrange multiplier 는 일반적으로 , 또는 다른 기호 로 대체 되지만 속성은 유지합니다 k λ λ 0α2kλλ0

이 답변을 공식화하면서, 나는 Wikipedia전달 함수 가중치의 Ridge 추정 에서 자유롭게 빌리는 것을 인정 합니다.


9
(+1) 완전성을 위해, 실제 적용에서 정규화 된 시스템은 일반적으로 하며, 이는 표준 선형 최소 제곱 문제로 해결 될 수 있습니다 (예 : QR / SVD를 통해) , 정규 방정식을 명시 적으로 형성하지 않음). [AαΓ]x[b0]A^xb^A^
GeoMatt22

좋은 지적. 나중에 추가하겠습니다.
Carl

스무딩 스플라인 및 유사한 기본 확장 방법이 Tikhonov 정규화의 하위 집합입니까?
Sycorax는 Reinstate Monica가

@ Sycorax 나는 그렇게 기대하지 않습니다. 예를 들어, B- 스플라인은 끝점에서 도함수를 0으로 설정하고 끝점 사이의 데이터에 대해 스플라인의 파생물과 크기를 일치시킵니다. Tikhonov 정규화는 맞춤 경사를 변경하여 사용자에게 알려주는 매개 변수 오류를 최소화합니다. 그래서 다른 것들.
Carl

또한, Tychonov 정규화는 (분리 가능한?) 힐버트 공간에 대해 임의의 차원으로 공식화되었습니다.
AIM_BLB

23

Carl은 Tikhonov 정규화와 능선 회귀의 수학적 차이점을 잘 설명하는 철저한 대답을했습니다. 여기서 역사적인 토론 에서 영감을 받아 보다 일반적인 Tikhonov 프레임 워크가 어떻게 유용한 지 보여주는 간단한 예를 추가하는 것이 도움이 될 것이라고 생각했습니다.

먼저 문맥에 대한 간단한 메모입니다. 릿지 회귀 는 통계에서 발생했으며, 정규화 는 통계 및 기계 학습에서 널리 퍼져 있지만 Tikhonov의 접근 방식은 원래 모델 기반 데이터 동화 (특히 지구 물리학 ) 에서 발생하는 역 문제로 인해 동기가 부여되었습니다 . 아래의 단순화 된 예는이 범주에 있습니다 ( 고 아기 재구성에 더 복잡한 버전이 사용됨 ).


현재의 측정 값 기초하여 과거에 온도 을 재구성하고 싶다고 상상해보십시오 . 단순화 된 모델에서 우리는 온도 가 주기적 경계 조건 로 1D에서 열 방정식 에 따라 진화한다고 가정합니다 . 단순 (명시 적) 유한 차분 접근법 이산 모델 수학적으로, 진화 행렬 는 돌이킬 수 없으므로 그러나 수치 적으로u [ x , t = T ]u[x,t=0]u[x,t=T] u [ x + L , t ] = u [ x , t ] Δ u

ut=uxx
u[x+L,t]=u[x,t]
A u t = A 1 u t + 1 T
ΔuΔt=LuΔx2ut+1=Aut
A
ut=A1ut+1
시간 간격 ( 이 너무 길면 어려움이 발생한다 .T

Tikhonov 정규화는 해결하여이 문제를 해결할 수 있습니다. 거칠기 에 작은 패널티 를 추가합니다 . ω21

Autut+1ωLut0
ω21uxx

아래는 결과를 비교 한 것입니다.

티코 노프 vs. 체커 보드

우리는 원래 온도 가 부드러운 프로파일을 가지고 있음을 알 수 있습니다 . 이것은 를 제공하기 위해 확산에 의해 더욱 부드럽게 됩니다. 직접 반전은 을 복구하지 못하고 솔루션 는 강력한 "체커 보드" 아티팩트를 표시합니다. 그러나 Tikhonov 솔루션 는 아주 좋은 정확도로 을 복구 할 수 있습니다.U를 F w D U 0 U I N V U R E gu0ufwdu0uinvuregu0

이 예에서, 융기 회귀는 항상 우리의 솔루션을 "얼음 나이"(즉, 균일 한 영점 온도)로 향하게합니다. 티호 노프의 회귀는 우리에게 더 유연 할 수 있습니다 물리적 기반의 이전 제약 조건을 : 여기에 우리의 처벌은 본질적으로 재구성 말한다 진화 천천히해야한다, 즉 .u t0uut0


예제의 Matlab 코드는 다음과 같습니다 ( 여기 에서 온라인으로 실행할 수 있음 ).

% Tikhonov Regularization Example: Inverse Heat Equation
n=15; t=2e1; w=1e-2; % grid size, # time steps, regularization
L=toeplitz(sparse([-2,1,zeros(1,n-3),1]/2)); % laplacian (periodic BCs)
A=(speye(n)+L)^t; % forward operator (diffusion)
x=(0:n-1)'; u0=sin(2*pi*x/n); % initial condition (periodic & smooth)
ufwd=A*u0; % forward model
uinv=A\ufwd; % inverse model
ureg=[A;w*L]\[ufwd;zeros(n,1)]; % regularized inverse
plot(x,u0,'k.-',x,ufwd,'k:',x,uinv,'r.:',x,ureg,'ro');
set(legend('u_0','u_{fwd}','u_{inv}','u_{reg}'),'box','off');

모든 칭찬은 따뜻하게 받았습니다. 주제를 약간 벗어난 경우에도 Tikhonov 정규화와 능선 회귀 모두 물리적 회귀 목표를 타겟팅하는 데 사용할 수 있다고 언급하는 것이 좋습니다 . (+1)
Carl

2
@Carl 이것은 사실입니다. 변수를 로 전환 하여 여기 에서도 사용할 수 있습니다 ! (일반적으로 v=Lu
비가
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.