라고 가정하십시오 .
우리는 모르는 정확히 각 예측, 만의 상관 관계 .
통상 최소 제곱 (OLS) 용액은 및 문제는 없다.
그러나 가 단수 (다중 공선 성)에 가깝고 최적의 능선 모수를 추정해야한다고 가정합니다. 모든 방법에는 정확한 값이 필요한 것 같습니다 .
만 알려진 대안 방법 이 있습니까?
라고 가정하십시오 .
우리는 모르는 정확히 각 예측, 만의 상관 관계 .
통상 최소 제곱 (OLS) 용액은 및 문제는 없다.
그러나 가 단수 (다중 공선 성)에 가깝고 최적의 능선 모수를 추정해야한다고 가정합니다. 모든 방법에는 정확한 값이 필요한 것 같습니다 .
만 알려진 대안 방법 이 있습니까?
답변:
이것은 흥미로운 질문입니다. 놀랍게도 특정 가정 하에서 무언가를 수행하는 것이 가능하지만 잔차 분산에 대한 정보가 손실 될 수 있습니다. 얼마나 손실되는지에 달려 있습니다.
하자 다음 특이 값 분해 고려 의 와 직교 열을 가진 행렬 대각 행렬 긍정적 특이 값으로 대각선에서 및 a 직교 행렬. 그런 다음 의 열은 의 열 공간에 대한 직교 정규 기저를 형성 하고 에서이 열 공간 에 를 투영하기위한 계수의 벡터입니다 . X U n × p D d 1 ≥ d 2 ≥ . . . ≥ d p > 0 V p × p U X Z = U t Y = D − 1 V t V D U t Y = D − 1 V t X t Y Y U Z X
주어진 대한 능형 회귀 예측 변수는 로 계산 될 수 있으므로 열 기준 릿지 회귀 예측 변수의 계수 는 이제 는 차원 평균 및 공분산 행렬 갖는 분포 가정을합니다 . 이어서 갖는 차원 평균 및 공분산 행렬 . 우리가 독립을 상상한다면Y = X ( X t X + λ I ) - (1) X t Y = U D ( D 2 + λ I ) - 1 D U t Y = U D ( D 2 + λ I ) - 1 D Z U Z = D ( D 2 + λ I
표준 계산으로 여기서 는 매개 변수 하여 능선 회귀에 대한 유효 자유도라고합니다 . 의 바이어스되지 않은 추정량 은
이를 의 (비 편향) 추정값 와 결합합니다. 우리가 알고 있다면 최소화해야합니다. 우리가 알고있는 경우에 분명히,이 경우에만 수행 할 수 있습니다 또는 합리적인 추측이나 추정이 .
추정하는 것이 더 문제가 될 수 있습니다. 또한 표시 할 수있다 따라서 너무 작게 선택 하여 제곱 바이어스를 무시할 수 있다면 를 로 추정 할 수 있습니다. 이것이 작동한다면 많이 의존합니다 .λσ2σ2=1
문제에서와 같이 를 정의 하고 다양한 매개 변수 대해 를 정의 하고 샘플 레이블의 를 설정합니다 . 그런 다음 는 계산할 수 없으므로 알 수없는 모두 규범. λ
이는 다음 알고리즘으로 이어집니다.