맥파든의 의사 R2 해석


29

지불 (1 = 지불 및 0 = 지불 없음)이라는 종속 변수가있는 McFadden의 의사 R 제곱이 0.192 인 이진 로지스틱 회귀 모델이 있습니다. 이 의사 R- 제곱의 해석은 무엇입니까?

중첩 모델에 대한 상대 비교입니까 (예 : 6 개의 변수 모델의 McFadden의 의사 R- 제곱은 0.192이지만 5 개의 변수 모델 (상기 6 개의 변수 모델에서 하나의 변수를 제거한 후),이 5 개의 변수 모델은 의사 R입니다) -제곱 0.131. 모형에서 6 번째 변수를 유지하겠습니까?) 절대 수량입니까 (예 : McFadden의 의사 R- 제곱이 0.192 인 지정된 모델이 McFadden의 의사를 가진 기존 모델보다 낫습니다) 0.180의 R- 제곱 (중심하지 않은 모델의 경우에도) McFadden의 의사 R- 제곱을 보는 가능한 방법 일 뿐이지 만이 두 가지 견해를 벗어난 것으로 가정하므로이 질문을하는 이유가 여기에 있습니다.

나는이 주제에 대해 많은 연구를 해 왔지만 McFadden의 의사 R 제곱 0.192를 해석 할 수 있다는 관점에서 아직 찾고있는 답을 찾지 못했습니다. 모든 통찰력 및 / 또는 참조는 대단히 감사합니다! 이 질문에 대답하기 전에 이것이 로지스틱 회귀 모델을 설명하는 가장 좋은 방법은 아니라는 것을 알고 있습니다. 그러나이 통계를 더 잘 이해하고 싶습니다!

답변:


34

그래서 나는 McFadden의 의사 R2에 대해 배운 것을 올바른 대답으로 요약했습니다.

McFadden의 유사 R2에 대해 볼 수있는 중요한 참고 자료는 다음과 같습니다. McFadden, D. (1974)“정 성적 선택 행동의 조건 적 로짓 분석”Pp. P. Zarembka (ed.)의 105-142, 계량 경제학의 프론티어. 학술 출판사. http://eml.berkeley.edu/~mcfadden/travel.html 그림 5.5는 OLS의 rho-squared와 전통적인 R2 측정 값의 관계를 보여줍니다. 내 해석은 rho-squared (McFadden의 의사 R2)의 값이 클수록 작은 것보다 낫다는 것입니다.

0.2-0.4 사이의 McFadden의 의사 R2에 대한 해석은 그가 기여한 책 장에서 온 것입니다 : Bahvioural Travel Modelling. David Hensher와 Peter Stopher에 의해 편집 됨. 1979. McFadden은 Ch. 15 "개인의 여행 행동을 분석하기위한 정량적 방법 : 일부 최근 개발" 모델 평가에 대한 논의 (다항식 로짓 모델과 관련하여)는 306 페이지에서 시작하여 rho-squared (McFadden의 유사 R2)를 소개합니다. McFadden은 "R2 지수는 OLS에 경험이있는 계획자에게 더 친숙한 개념이지만 ML 추정에 대해서는 rho-squared 측정만큼 잘 작동하지 않습니다. rho-squared에 익숙하지 않은 사용자는 그 값이 예를 들어 rho-squared의 경우 0.2에서 0.4 사이의 값은 EXCELLENT fit을 나타냅니다.

따라서 기본적으로 rho-squared는 R2와 같이 해석 될 수 있지만 크지 않을 것으로 예상됩니다. 그리고 0.2-0.4의 값은 (McFadden의 말로) 우수한 모델 적합을 나타냅니다.


잘 했어, 크리스 당신의 노력에 감사드립니다!
Matt Reichenbach

13

McFadden의 R 제곱은 1-l_mod / l_null로 정의되며, 여기서 l_mod는 적합 모형에 대한 로그 우도 값이고 l_null은 예측 변수로 인터셉트 만 포함하는 null 모형에 대한 로그 우도입니다 (모든 개인이 동일한 확률을 예측할 수 있도록) 성공 ').

로지스틱 회귀 모형의 경우 로그 우도 값은 항상 음수입니다 (각 관측치의 우도 기여는 0과 1 사이의 확률이므로). 모형이 실제로 널 모형보다 더 나은 결과를 예측하지 않으면 l_mod는 l_null보다 크게 크지 않으므로 l_mod / l_null은 약 1이고 McFadden의 R 제곱은 0에 가깝습니다 (모델에 예측 값이 없음) .

반대로, 모델이 실제로 좋으면 결과 (1)에 성공한 개인은 확률이 1에 가까워지고 결과에 실패한 (0) 결과에 대해서는 그 반대가됩니다. 이 경우 우도 계산을 수행하면 모형에 대한 각 개인의 우도 기여도가 0에 가까워져 l_mod가 0에 가까워지고 McFadden의 R 제곱이 1에 가까워져 매우 우수한 예측 능력을 나타냅니다.

좋은 가치로 간주 될 수있는 것과 관련하여 필자의 개인적인 견해는 통계에서 비슷한 질문 (예 : 큰 상관 관계를 구성하는 요소)과 같은 결정적인 대답이 될 수 없다는 것입니다. 작년에 나는 McFadden의 R에 대한 로지스틱 회귀 분석에 대한 블로그 게시물을 썼는데 , 여기에는 시뮬레이션 그림이 더 있습니다.


5

나는이 주제에 대해 좀 더 집중적 인 연구를했으며, McFadden의 유사 R- 제곱 (우도 비 지수라고도 함)에 대한 해석이 명확하지 않다는 것을 알았습니다. 그러나 0-1 범위 일 수 있지만 계산 결과 1에 도달하거나 초과하지 않습니다.

내가 매우 도움이되는 것으로 알려진 규칙은 0.2에서 0.4 사이의 McFadden의 의사 R- 제곱은 매우 좋은 모델 적합을 나타냅니다. 따라서 McFadden의 의사 R- 제곱이 0.192 인 위에서 언급 한 모델은 적어도이 지표에 따르면 끔찍한 모델은 아니지만 특히 강하지는 않습니다.

McFadden의 유사 R- 제곱은 동일한 모델 (예 : 중첩 모델)의 서로 다른 사양을 비교하는 데 가장 적합합니다. 앞서 언급 한 예를 참조하면 6 변수 모델 (McFadden의 의사 R- 제곱 = 0.192)은 5 가지 변수 모델 (McFadden의 의사 R- 제곱 = 0.131)보다 데이터에 더 적합합니다. 이는 로그 우도 비 테스트를 사용하여 공식적으로 테스트했습니다. 이는 두 모델간에 유의 한 차이 ( p <0.001) 가 있음을 나타내 므로 6 개의 가변 모델이 주어진 데이터 세트에 대해 선호됩니다.


1
0.2에서 0.4 사이의 McFadden의 R2가 "매우 우수"하다고 주장하는 참조는 무엇입니까?
Chris

Btw ... 여기에 그의 의사 R2 측정을 정의하는 원래 McFadden 기사에 대한 참조 및 링크가 있습니다. McFadden, D. (1974)“정 성적 선택 행동의 조건 적 로짓 분석.”Pp. P. Zarembka (ed.)의 105-142, 계량 경제학의 프론티어. 학술 출판사. elsa.berkeley.edu/reprints/mcfadden/zarembka.pdf
크리스

1
참조 주셔서 감사합니다. 그의 버클리 웹 사이트에서 많은 McFadden의 작품을 찾을 수 있습니다. 아래는 위에서 인용 한 전체 책의 링크입니다. elsa.berkeley.edu/users/mcfadden/travel.html 모든 장은 PDF로 나타납니다. Rho-square (McFadden의 의사 R2)는 5 장에 언급되어있다 (페이지 5.122 및 그 직후에 나오는 그래프 참조). 0.2-0.4 = "VG model fit"에 대한 언급이 없습니다. 나는이 "엄지 손가락 규칙"의 중요한 모습을 계속 검색 할 것입니다. 당신의 도움을 주셔서 감사합니다!
Chris

1
문제 없어! 당신의 호기심과 철저함에 감사드립니다. 정확한 문구는 lifesciencesite.com/lsj/life1002/… 에서 찾을 수 있습니다 . 여기서 저자는 "McFadden의 의사 r- 제곱 (ρ2)을 사용하여 적합도를 사용하여 전체 모형을 적합하게합니다."라고 McFadden은 제안했습니다. 0.2에서 0.4 사이의 값은 모델에 매우 잘 맞는 것을 나타내야한다 (Louviere et al., 2000). "
Matt Reichenbach

4
우리 기관에는 Louviere et al (2000)의 전자 사본이 있습니다. "명시된 선택 방법 : 분석 및 응용 프로그램". 케임브리지 대학 출판부. 이것은 Lee (Life Science Journal)가 {0.2-0.4}에서 rho-squared = "VG fit"으로 인용 한 참고 문헌입니다. Louviere의 55 페이지 (방정식 3.32와 연관 됨)에서 다음과 같은 인용문을 볼 수 있습니다. "0.2-0.4 사이의 rho-squared 값은 매우 적합한 모형 적합을 나타내는 것으로 간주됩니다. Domenich와 McFadden (1975) 동등성에 의한 시뮬레이션은 선형 기능의 경우 0.7 ~ 0.9 "
Chris

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.