두 변수의 로그 사이에 선형 관계가 있다는 직관적 인 의미는 무엇입니까?


20

서로에 대해 플롯 할 때 많은 상관 관계를 보이지 않는 두 개의 변수가 있지만 각 변수의 로그를 다른 로그에 다시 그릴 때 매우 명확한 선형 관계가 있습니다.

그래서 나는 유형의 모델로 끝날 것입니다 :

log(Y)=alog(X)+b
. 수학적으로 훌륭하지만 정규 선형 모델의 설명 값이없는 것 같습니다.

그러한 모델을 어떻게 해석 할 수 있습니까?


5
기존 답변에 추가 할 실질적인 것은 없지만 결과와 예측의 로그는 탄력적입니다. 해당 용어를 검색하면 관계를 해석하는 데 도움이되는 좋은 자료를 찾아야합니다.
Upper_Case-Stop Harming Monica

종속 변수가 log (y)이고 독립 변수가 log (x) 인 로그-로그 모델의 해석은 다음과 같습니다. %Δ=β1%Δx .

3
보완 로그-로그 링크는 결과가 이진 (위험 모델)이고 노출이 누적되는 경우 (예 : 성 파트너 수 vs HIV 감염) 이상적인 GLM 사양입니다. jstor.org/stable/2532454
AdamO

2
@Alexis 곡선을 오버레이하면 고정 점을 볼 수 있습니다. curve(exp(-exp(x)), from=-5, to=5)vs을 사용해보십시오 curve(plogis(x), from=-5, to=5). 오목 함이 가속화됩니다. 단일 발생으로 인한 이벤트 위험이 이면 두 번째 이벤트 이후의 위험은 등 이어야하며 , 이는 확률 적 형태 로짓이 포착하지 않습니다. 노출이 높을수록 로지스틱 회귀 분석 결과가 더 극적으로 왜곡 될 수 있습니다 (사전 확률 규칙에 따라 거짓). 어떤 시뮬레이션은 이것을 보여줄 것입니다. (1) - ( 1 - P ) (2)p1(1p)2
AdamO

1
@AdamO 아마도 그러한 차이를 만들지 않는 상황을 포함하여 세 가지 중에서 특정한 이분법적인 결과 링크를 선택하는 방법에 동기를 부여하는 그러한 시뮬레이션을 통합 한 교육학 논문이있을 것입니다.
Alexis

답변:


27

방정식의 양변을 지수로 나타내면 잠재적 인 관계가 생겨 일부 데이터에 적합 할 수 있습니다.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

이후 양의 값을 취할 수 단지 파라미터이며,이 모델은 등가이다 :eb

Y=cXa

모델 표현식에는 오류 항이 포함되어야하며 이러한 변수 변경은 흥미로운 영향을 미칩니다.

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

즉, OLS 조건 (정규 분산을 갖는 정규 분포 오차)을 따르는 가산 성 오차가있는 모형은 로그가 상수 분산이있는 정규 분포를 따르는 곱셈 오차가있는 잠재적 모형과 같습니다.


3
OP는이 배포판의 이름이 log-normal이라는 것을 알고 싶어 할 것입니다. en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
젠슨 불평등의 영향은 어떻습니까? 일반적으로 볼록한 g의 경우, E[g(X)]g(E[X])
통계

14

모형 log(Y)=alog(X)+b 를 사용하여 총 차이를 계산하면 다음과 같은 결과가 나타납니다.

1YdY=a1XdX
dY 를 산출하는 X dX
dYdXXY=a

그러므로, 계수의 간단한 해석 a 변경 률 것이다 Y 의 변화율에 대한 X . 이는 또한 가변 YX 의 성장 속도의 일정한 분율 ( a ) 에서 성장 한다는 것을 의미한다 .X


따라서 로그-로그 플롯이 선형이라면, 지속적인 성장률을 의미합니까?
Dimitriy V. Masterov

실제로는 아니지만 의 성장률은 a = 0 인 경우에만 일정합니다 . Ya=0
RScrlli

시간이 지남에 따라 x의 성장에 대한 성장률.
Dimitriy V. Masterov

재정렬은 도움이되지 않습니다. 제거하겠습니다
Aksakal

1
@ DimitriyV.Masterov Ok, log ( X ) 에서 선형 이기 때문에 변수 YX 의 성장 속도의 일정한 비율로 성장 한다는 것을 의미합니다 . 당신에 따르면 내 대답에 문제가 있습니까? log(Y)log(X)YX
RScrlli

7

직관적으로 log 는 변수 의 크기 순서를 제공 하므로 두 변수의 크기 순서가 선형으로 관련되어 있기 때문에 관계를 볼 수 있습니다. 예를 들어, 예측자를 하나의 차수만큼 증가시키는 것은 응답의 세 차수의 증가와 관련 될 수있다.

로그-로그 플롯을 사용하여 플로팅 할 때 선형 관계를 보길 바랍니다. 이 질문 의 예를 사용 하여 선형 모델 가정을 확인할 수 있습니다.

로그-로그


3
직관적이지 않은 개념에 대한 직관적 인 답변은 +1입니다. 그러나 포함한 이미지는 예측 변수 전체의 일정한 오차 분산을 명확하게 위반합니다.
Frans Rodenburg

1
정답은 맞지만 저작자 표시는 잘못되었습니다. 이미지는 Google 이미지에 의한 것이 아니라 적어도 이미지가있는 웹 페이지에 기인 한 것이지 Google 이미지를 클릭하면 찾을 수 있습니다.
Pere

@Pere 불행히도 이미지의 원본을 찾을 수 없습니다 (적어도 역 이미지 검색 사용)
qwr

비록 그것은 사이트가 다운되었고 대부분의 페이지가 홈페이지 와는 별도로 웹 아카이브에 있지는 않지만 원래 diagramss.us 에서 온 것 같습니다
Henry

4

@Rscrill의 답변을 실제 이산 데이터와 조정하려면 다음을 고려하십시오.

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

그러나

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1Yt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

따라서 우리는

gYtagXt

실증 연구에서 @Rscrill의 이론적 처리를 검증합니다.


1
이것은 아마도 수학자가 직관적 이라고 부르는 것입니다 :)
Richard Hardy

2

로그 사이의 선형 관계는 전력 법 의존성에 해당합니다.

와이엑스α
물리학에서 그러한 행동은 시스템이 스케일이 없거나 스케일이 변하지 않음을 의미 합니다. 예를 들어엑스 거리 또는 시간입니다. 이것은 엑스특징적인 길이나 시간 척도로 특징 지을 수 없습니다 (지수 적 붕괴와 반대) 결과적으로 이러한 시스템은 장거리 의존성을 나타냅니다.와이엑스.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.