로그 변환 예측 변수 및 / 또는 응답의 해석


46

종속 변수, 종속 변수 및 독립 변수 또는 독립 변수 만 로그 변환인지 해석에 차이가 있는지 궁금합니다.

의 경우를 고려

log(DV) = Intercept + B1*IV + Error 

IV를 백분율 증가로 해석 할 수 있지만

log(DV) = Intercept + B1*log(IV) + Error

또는 내가있을 때

DV = Intercept + B1*log(IV) + Error

?


1
나는 "퍼센트 증가"해석이 정확하지 않다는 느낌을 받았지만 왜 그런지 정확히 말할 수있는 충분한 지식이 없습니다. 누군가가 도울 수 있기를 바랍니다 .... XY 관계를 더 잘 확립하는 데 도움이되는 로그를 사용하여 모델링 하는 것이 좋지만 원래 변수를 사용하여 해당 관계의 선택된 예를 보고 하는 것이 좋습니다 . 특히 기술적으로 정통하지 않은 청중을 다루는 경우.
rolando2

3
@ rolando2 : 동의하지 않습니다. 유효한 모델에 변환이 필요한 경우 유효한 해석은 일반적으로 변환 된 모델의 계수에 의존합니다. 이러한 계수의 의미를 청중에게 적절하게 전달하는 것은 조사자의 책임입니다. 물론, 왜 우리는 월급이 로그 변환되어야하는 큰 돈을 지불해야 하는가.
jthetzel

1
@BigBucks : 글쎄, 이런 식으로보세요. X의 로그 (기본 10)에서 1의 모든 변경에 대해 Y가 b로 변경된다고 설명 할 때 청중이 의미를 이해하지 못한다고 가정하십시오. 그러나 10, 100 및 1000의 X 값을 사용하여 3 개의 예를 이해할 수 있다고 가정합니다.이 시점에서 관계의 비선형 특성을 따라 잡을 수 있습니다. 전체 로그 기반 b를 계속보고 할 수 있지만 이러한 예를 제공하면 모든 차이가 생길 수 있습니다.
rolando2

1
.... 이제 아래의 훌륭한 설명을 읽었으므로 이러한 "템플릿"을 사용하면 많은 사람들이 이러한 종류의 문제를 이해하는 데 도움이 될 수 있습니다.
rolando2

답변:


42

Charlie는 훌륭하고 올바른 설명을 제공합니다. UCLA의 통계 계산 사이트에는 몇 가지 추가 예가 있습니다. http://www.ats.ucla.edu/stat/sas/faq/sas_interpret_log.htmhttp://www.ats.ucla.edu/stat/mult_pkg/ 자주 묻는 질문 / 일반 /log_transformed_regression.htm

Charlie의 답변을 보완하기 위해 아래는 예제에 대한 구체적인 해석입니다. 항상 그렇듯이 계수 해석은 모형을 방어 할 수 있고 회귀 진단이 만족스럽고 데이터가 유효한 연구에서 나온 것으로 가정합니다.

예 A : 변환 없음

DV = Intercept + B1 * IV + Error 

"IV의 한 단위 B1증가는 DV 의 ( ) 단위 증가 와 관련이 있습니다."

예 B : 결과 변환

log(DV) = Intercept + B1 * IV + Error 

"IV의 한 단위 B1 * 100증가는 DV 의 ( ) 퍼센트 증가 와 관련이 있습니다."

예 C : 노출 변환

DV = Intercept + B1 * log(IV) + Error 

"IV의 1 % B1 / 100증가는 DV 의 ( ) 단위 증가 와 관련이 있습니다."

예 D : 결과 변환 및 노출 변환

log(DV) = Intercept + B1 * log(IV) + Error 

"IV의 1 % B1증가는 DV 의 ( %) 증가 와 관련이 있습니다."


1
이 해석은 로그의 기초에 관계없이 유지됩니까?
Ayalew A.

예 B : 결과 변환 된 로그 (DV) = 절편 + B1 * IV + 오류 "IV의 한 단위 증가는 DV의 (B1 * 100) 증가와 관련이 있습니다.이 경우 30 %를 원하는 경우 어떻게합니까 DV 축소
Antouria

DV ~ B1 * log (IV)는 제로 경계 연속 종속 변수에 적합한 모델입니까?
바카 부르크

2
혼란 스러울 수 있습니다. 결과를 로그 변환하면 곱셈 차이를 찾기 위해 계수를 다시 지수화해야합니다. 로그 스케일로 해석하면 비율이 1에 매우 가까운 경우에만 근사값으로 작동합니다.
AdamO

링크가 끊어졌습니다.
Nick Cox

22

log-log- 모델에서 기억 또는 이 후자의 공식에 100을 곱하면 의 퍼센트 변화가 나타납니다 . 우리는 비슷한 결과를 얻었습니다 .

β1=log(y)log(x).
log(y)y=1y
log(y)=yy.
yx

이 사실을 사용하여 을 의 1 % 변화에 대한 변화 백분율로 해석 할 수 있습니다 .β1yx

동일한 논리에 따라 레벨 로그 모델에 대해

β1=ylog(x)=100y100×log(x).
또는 은 의 1 % 변화에 대한 단위 변화입니다 .β1/100yx

나는 이것을 파악한 적이 없다. 그것은 똑 바른 것이지만 나는 그것을 본 적이 없다 ... 정확히 그리고 여기에서 백분율 변경으로 어떻게 가나 요?
log(y)=yy?
B_Miner

1
모든 라인의 유도체 취 않는다 관련하여 에 의해 곱 양쪽 . 우리는이 . 이 부분은 다음의 변화 에 의해 분할 . 100을 곱하면 의 백분율 변화입니다 . log(y)yyyy1y0yyy
Charlie

7

선형 회귀의 주요 목적은 인접한 회귀 수준을 비교하여 평균 결과 차이를 추정하는 것입니다. 많은 유형의 수단이 있습니다. 우리는 산술 평균에 가장 익숙합니다.

AM(X)=(X1+X2++Xn)n

AM은 OLS 및 변형되지 않은 변수를 사용하여 추정되는 것입니다. 기하학적 평균은 다릅니다 :

GM(X)=(X1×X2××Xn)n=exp(AM(log(X))

여기에 이미지 설명을 입력하십시오

실제로 GM 차이는 곱셈 차이입니다. 대출을 가정 할 때 이자율의 X %를 지불하고, 메트포르민을 시작한 후 헤모글로빈 수치가 X % 감소하고, 스프링의 실패율이 너비의 일부로 X % 증가합니다. 이 모든 경우에, 평균 평균 차이는 의미가 적습니다.

로그 변환은 기하학적 평균 차이를 추정합니다. 다음 공식 사양을 사용하여 결과를 로그 변환하고 선형 회귀로 모델링 log(y) ~ x하면 계수 은 인접한 단위를 비교 한 로그 결과 의 평균 차이입니다 . 이는 사실상 쓸모가 없으므로 매개 변수 하고이 값을 기하 평균 차이로 해석합니다. X e β 1β1Xeβ1

예를 들어, ART 투여 10 주 후 HIV 바이러스 부하에 대한 연구에서, 우리는 전치사 평균 추정 할 수 있습니다 . 이는 바이러스로드가 기준선에 있더라도 평균 60 % 더 낮 거나 후속 조치에서 0.6 배 감소했음을 의미합니다. 기준선에서 하중이 10,000 인 경우 내 모델은 후속 조치에서 4,000 일 것으로 예상하고, 기준선에서 1,000 인 경우 내 모델은 후속 조치에서 400 일 것으로 예상합니다 (원시 스케일의 작은 차이이지만 비례 적으로 동일).eβ1=0.40

이것은 다른 답변 과의 중요한 차이점입니다 . 로그 스케일 계수에 100을 곱하는 규칙은 가 작을 때 근사 에서 비롯됩니다 . (로그 스케일에서) 계수가 0.05라면, 이고 해석은 다음과 같습니다 : 에서 1 단위 "증가"에 대한 결과에서 5 % "증가" . 그러나 계수가 0.5 인 경우 이고 의 1 단위 "증가"에 대해 에서 65 % "증가"로 해석합니다 . 50 % 증가하지 않습니다.X exp ( 0.05 ) 1.05 X exp ( 0.5 ) = 1.65 Y Xlog(x)1xXexp(0.05)1.05Xexp(0.5)=1.65YX

예측 변수를 로그 변환한다고 가정합니다 y ~ log(x, base=2). 여기서 나는 근본적인 차이보다는 의 곱셈 변화에 관심이 있습니다 . 이제 에서 2 배가 다른 참가자를 비교하는 데 관심이 있습니다. 예를 들어, 부가 위험 모델을 사용하여 다양한 농도에서 혈액 매개 병원체에 노출 된 후 감염 (예 ​​/ 아니오)을 측정하는 데 관심이 있다고 가정합니다. 생물학적 모델은 농도가 두 배가 될 때마다 위험이 비례 적으로 증가 함을 시사합니다. 그런 다음 결과를 변환하지는 않지만 추정 된 계수는 감염 물질의 2 배 농도 차이로 노출 된 그룹을 비교하는 위험 차이로 해석됩니다.X β 1xXβ1

마지막으로, log(y) ~ log(x)노출 수준에서 곱셈이 다른 ​​그룹을 비교하는 곱셈 차이를 얻기 위해 간단히 두 정의를 적용합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.