표준화 된 베타를 원래 변수로 다시 변환


15

나는 이것이 매우 간단한 질문이라는 것을 알고 있지만 검색 후 내가 찾고있는 답변을 찾을 수 없습니다.

베타의 능선 추정값을 계산하기 위해 변수 (릿지 회귀)를 실행하는 변수를 표준화 해야하는 문제가 있습니다.

그런 다음이를 원래 변수 척도로 다시 변환해야합니다.

하지만 어떻게해야합니까?

이변 량 사례에 대한 공식을 찾았습니다.

β=β^SxSy.

이것은 D. Gujarati, Basic Econometrics , page 175, 식 (6.3.8)에 제시되어 있습니다.

여기서 는 표준화 된 변수에서 회귀 실행의 추정값이고 는 원래 척도로 다시 변환 된 동일한 추정량이고, 는 회귀 분석 의 표본 표준 편차이고, 는 표본 표준 편차입니다.ββ^SySx

불행히도이 책은 다중 회귀에 대한 유사한 결과를 다루지 않습니다.

또한 나는 이변 량 사례를 이해하지 못합니까? 간단한 대수 조작은 원래 규모 로 에 대한 공식을 제공합니다 .β^

β^=βSySx

나에게 이상한 것 같다 이미 의해 수축되는 변수를 계산 하였다 에 의해 수축해야합니다 다시 변환 돌아올 수 있나요? (또한 평균값이 다시 추가되지 않는 이유는 무엇입니까?)β^SxSx

그래서 누군가가 결과를 이해할 수 있도록 파생적으로 다변량 사례에 대해이 작업을 수행하는 방법을 설명해 주시겠습니까?

답변:


27

표준화 된 변수를 사용하는 회귀 모형의 경우 회귀선에 대해 다음 형식을 가정합니다.

E[Y]=β0+j=1kβjzj,

여기서 j 번째 (규격화) 회귀로부터 생성 샘플 평균 빼서 상기 샘플의 표준 편차로 나눈 : zjxjx¯jSj

zj=xjx¯jSj

표준화 된 회귀 분석 도구를 사용하여 회귀 분석을 수행하면 적합 회귀선이 나타납니다.

Y^=β^0+j=1kβ^jzj

이제 표준화되지 않은 예측 변수에 대한 회귀 계수를 찾고자합니다. 우리는

Y^=β^0+j=1kβ^j(xjx¯jSj)

재정렬하면이 표현은 다음과 같이 쓸 수 있습니다.

Y^=(β^0j=1kβ^jx¯jSj)+j=1k(β^jSj)xj

보시다시피, 변환되지 않은 변수를 사용한 회귀에 대한 절편은 . 번째 예측 변수 의 회귀 계수 는 입니다.β^0j=1kβ^jx¯jSjjβ^jSj

제시된 경우, 예측 변수 만 표준화되었다고 가정했습니다. 반응 변수를 표준화하는 경우 공변량 계수를 원래 스케일로 다시 변환하는 것은 제공 한 참조의 공식을 사용하여 수행됩니다. 우리는 :

E[Y]y^Sy=β0+j=1kβjzj

회귀를 수행하면 적합 회귀 방정식을 얻습니다.

Y^scaled=Y^unscaledy¯Sy=β^0+j=1kβ^j(xjx¯jSj),

여기서 적합치가 표준화 된 반응의 척도에 있습니다. 그것들을 스케일링 해제하고 변환되지 않은 모델에 대한 계수 추정치를 복구하기 위해 방정식에 곱하고 의 샘플 평균을 다른쪽으로 가져옵니다 .Syy

Y^unscaled=β^0Sy+y¯+j=1kβ^j(SySj)(xjx¯j).

응답이나 예측 변수가 표준화되지 않은 모형에 해당하는 절편은 , 관심 모델에 대한 공변량 계수는 각 계수에 곱하여 얻을 수 있습니다 .β^0Sy+y¯j=1kβ^jSySjx¯jSy/Sj

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.