exp (계수)에서 Odds Ratio까지 및 Logistic Regression에서 요인에 대한 해석


14

나는 SAT 점수와 가족 / 민족적 배경에 대해 대학에 합격을 선형으로 회귀시켰다. 데이터는 허구입니다. 이것은 이미 답변 된 이전 질문에 대한 후속 조치입니다. 이 질문은 SAT 점수를 단순성으로 남겨 두는 경우 확률 비의 수집 및 해석에 중점을 둡니다.

변수는 Accepted(0 또는 1) 및 Background( "빨간색"또는 "파란색")입니다. 나는 "빨간색"배경의 사람들이 더 많이 들어갈 수 있도록 데이터를 설정했습니다.

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

질문 :

  1. 0.7 "청색"배경의 사람의 홀수 비율이 허용됩니까? Backgroundblue대신 다음 코드를 실행하면 " "에 대해 0.7 "을 얻으므로 이것을 묻습니다 .

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
  2. 이자형이자형/아르 자형이자형:이자형이자형/이자형영형에스이자형=1/영형에스아르 자형이자형


1
무엇 R명시 적으로 호출 계수를 (기능을 통해 coef당신이 당신의 출력에서 "교차비"을 요구하고있다). 즉 , 둘 사이의 차이점
whuber

하이퍼 링크의 게시물을 읽었습니다.
Antoni Parellada 2019

계수는 지수 (exp (coef (fit)))입니다.
Antoni Parellada 2019

예 : 그 스레드에서 내 대답에 설명 된 것처럼 인터셉트의 지수화 는 참조 사례 의 확률 을 제공합니다 .
whuber

답변:


13

확률과 확률 비율을 수동으로 계산하여 내 질문에 대답하려고 노력했습니다.

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

따라서 Red over Blue 학교에 입학 하는 확률 은 다음과 같습니다.

영형에스 이자형 나는에프 아르 자형이자형영형에스 이자형 나는에프 이자형=177/102112/158=1.73530.7089=2.448

그리고 이것은 다음의 Backgroundred귀환입니다.

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

동시에, 확률(Intercept)확률 비율 의 분자에 해당하며 , 이는 '파란색'가족 배경이 될 확률 입니다.112/158=0.7089.

대신에 나는 다음을 실행합니다.

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

수익이 정확하게있는 확률 '블루'존재에 점점 : Backgroundblue(0.7089)과 확률 되고 받아 들여지고의 '빨간색' Backgroundred(1.7353). 아니 교차비 가. 따라서 두 개의 반환 값은 역수 일 것으로 예상되지 않습니다.

마지막으로 categorical regressor에 3 가지 요소가있는 경우 결과를 읽는 방법은 무엇입니까?

동일한 수동 대 [R] 계산 :

동일한 전제로 다른 가상의 데이터 세트를 만들었지 만 이번에는 "빨간색", "파란색"및 "오렌지색"이라는 세 가지 민족적 배경이 있었고 동일한 순서를 실행했습니다.

우선, 우발 사태 표 :

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

그리고 각 인종 그룹에 참여할 확률 을 계산했습니다 .

  • 빨간색 = 1.246154 인 경우 승률
  • 파란색 = 0.744186 인 경우 승률
  • 오렌지 = 0.646154 인 경우 승률

다른 승률 비율 뿐만 아니라 :

  • 또는 적색 v 청색 = 1.674519;
  • 또는 적색 v 주황색 = 1.928571;
  • 또는 청색 v 적색 = 0.597186;
  • 또는 청색 v 주황색 = 1.151717;
  • OR 주황색 v 적색 = 0.518519; 과
  • OR 주황색 v 파란색 = 0.868269

그리고 이제는 일상적인 로지스틱 회귀 분석을 수행 한 다음 계수를 지수화했습니다.

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

항복 확률 은 AS "블루스"를 점점의 (Intercept), 그리고 확율 비율 블루 대에 오렌지 Backgroundorange와의 OR 레드의 V 블루 Backgroundred.

다른 한편으로, 가로 채기없이 회귀는 세 개의 독립적 인 확률을 예측할 수있게 반환했습니다 .

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

축하합니다, 당신은 이것을 알아내는 좋은 일을했습니다.
gung-복직 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.