로지스틱 회귀 결과보고


13

다음과 같은 로지스틱 회귀 출력이 있습니다.

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   0.5716     0.1734   3.297 0.000978 ***
R1           -0.4662     0.2183  -2.136 0.032697 *  
R2           -0.5270     0.2590  -2.035 0.041898 *  

이를 다음과 같은 방식으로보고하는 것이 적절합니다.

베타 계수, 승산 비, Z 값, P 값. 그렇다면 홀수 비율을 어떻게 얻을 수 있습니까?


답변:


9

z- 값과 p- 값은 중복되지만 테이블에 대한 제안 된보고는 합리적입니다. 내가 아는 많은 저널은 z- 값 / p- 값을 전혀보고하지 않으며 통계적 유의성을보고하기 위해 별표 만 사용합니다. 또한 공간이 테이블에 허용되면 로그 확률과 확률 비율이 모두 선호되지만 로그 테이블과 홀수 비율이보고 된 물류 테이블 만 보았습니다.

그러나 장소마다보고 절차에 대한 가이드가 다르므로 예상되는 내용이 다를 수 있습니다. 저널에 논문을 제출하는 경우 다른 최근 논문이 어떻게 테이블을 만들 었는지 자주보고 모방 할뿐입니다. 자신의 개인 용지 인 경우 검토중인 사람에게 요청하는 것이 합리적입니다. 위에서 언급했듯이 일부 장소의 공간 제약으로 인해 궁극적으로 중복 정보 (예 : 로그 확률 및 확률 비율)를보고하지 못할 수 있습니다. 어떤 곳에서는 결과를 전적으로 텍스트로보고해야 할 수도 있습니다!

보고 할 다른 모델 요약에 대한 질문도 있습니다. 의사 값 을 자주보고하는 데 익숙한 많은 저널이 있지만 여기 에는 다양한 측정의 약점을 설명하는 스레드가 있습니다. 나는 개인적으로 분류 율이보고되는 것을 선호하지만 다시 한 번 이것은 장소에 따라 다르다고 생각한다 (일부 저널은 특히 의사 측정법 중 하나 가보고 될 것을 상상할 수있다 ).R2R2

홀수의 비율을 얻으려면 회귀 계수를 지수화하십시오 (예 : 여기서 는 자연 로그 의 기초 이고 는 추정 된 로지스틱 회귀 계수)). 이것을 계산하는 통계 언어에서는입니다 .eβ^eβ^exp(coefficient)

참고로, 이것이 현재 허용되는 답변이지만, lejohn과 Frank Harrell은 매우 유용한 조언을 제공합니다. 일반적으로 질문의 통계가 항상 어딘가에보고되기를 원하지만 다른 측정에 대한 다른 답변은 모델의 다른 추정 효과와 비교하여 효과 크기를 평가하는 유용한 방법입니다. 그래픽 절차는 상대 효과 크기를 조사하는 데 유용하며, 표를 예로 그래프로 변환하는 방법에 대한이 두 논문을 참조하십시오 ( Kastellec & Leoni, 2007 ; Gelman et al., 2002 )


Kastellec & Leoni, 2007 링크는 끊어졌지만 다음 은 코드가있는 동일한 논문의 예입니다.
ACNB

11

이 질문에 대한 답변은 징계 배경에 따라 달라질 수 있습니다.

다음은 일반적인 고려 사항입니다.

로지스틱 회귀 분석의 베타 버전은 직접 해석하기가 매우 어렵습니다. 따라서 명시 적으로보고하는 것은 매우 제한적입니다. 승산 비 또는 한계 효과를 고수해야합니다. 변수 x의 한계 효과는 종속 변수가 x와 관련하여 1 일 확률의 미분입니다. 결과를 제시하는이 방법은 경제학자들 사이에서 매우 인기가 있습니다. 개인적으로 나는 주변 효과 (배당률뿐만 아니라 ...)도 확률 비보다 한계 효과를 더 쉽게 이해할 수 있다고 믿는다.

또 다른 흥미로운 가능성은 그래픽 디스플레이를 사용하는 것입니다. 이 접근법의 일부 삽화를 볼 수있는 곳은 Gelman and Hill 입니다. 나는 이것이 한계 효과를보고하는 것보다 훨씬 낫다는 것을 안다.

승산 비를 얻는 방법에 대한 질문에 대해서는 R에서 어떻게 할 수 있습니까?

model <- glm(y ~ x1 + x2, family=binomial("logit"))
oddrat <- exp(coef(model))

한계 효과 추정값을 표 (또는 Gelman and Hill의 특정 페이지 참조)로 바꾸는 예가 있습니까?
Andy W

1
Gelman과 Hill은 실제로 예상 확률을 기반으로하는 한계 효과가 아니라 그래프를 사용합니다. 79 페이지에서 시작하여 5 장을 살펴보십시오.

10

계수와 반 로그 (홀수 비율)가 좋은 요약 인 특수한 경우에만 해당됩니다. 이것은 관계가 선형이고 예측 변수와 관련된 계수가 하나 일 때, 그리고 한 단위 변화가 승산 비를 계산하기에 좋은 기초가 될 때입니다 (연령에 대해 더 좋고, 범위가 500-100,000). 일반적으로 사 분위 범위 확률 비율과 같은 것이 유용합니다. 이에 대한 자세한 내용은 http://biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/rms.pdf에 있으며 R rms패키지는이 모든 것을 자동으로 수행합니다 (비선형 항과 상호 작용 처리, X의 사 분위수 계산, 기타.).


5

아마도 청중과 규율에 달려 있습니다. 아래의 대답은 역학 저널과 의료 저널에 대해 일반적으로 수행되는 것입니다.

무뚝뚝하게 우리는 p- 값에 신경 쓰지 않습니다. 진심으로, 우리는하지 않습니다. 전염병학 은 당신이 정말로 절실히 필요하고 현장이 본질적으로 뒤 따르지 않는 한 그것들을보고하게 할 수 없습니다.

우리는 질문에 따라 베타 견적에 신경 쓰지 않을 수도 있습니다. 귀하의 보고서가 좀 더 방법 론적이거나 시뮬레이션 지향적 인 것이라면 베타 추정 및 표준 오류를보고 할 것입니다. 모집단에서 추정 한 효과를보고하려는 경우 확률 비와 95 % 신뢰 구간을 고수합니다. 그것은 당신의 추정의 핵심이며, 그 분야의 독자들이 찾고자하는 것입니다.

승산 비를 얻는 방법에 대한 답변이 있지만 OR & 95 % CI에 대한 답변은 다음과 같습니다.

OR = exp(beta)
95% CI = exp(beta +/- 1.96*std error)

답변 해주셔서 감사합니다! 계산에서 1.96의 의미를 물어볼 수 있습니까?
07 초에

1
문제 없음 :) 95 % 신뢰 구간은 베타 추정치 정규 분포의 2.5 번째 백분위 수에서 97.5 번째 백분위 수까지의 범위입니다. 이러한 각 점은 평균 (이 경우 베타)에서 대략 1.96 표준 편차입니다.
Fomite

예,하지만 각 베타 계수에 대해이 작업을 수행해야합니까? 1.96도 바뀌나요? 또한 이것은 이항 데이터이며 여전히 정규 분포를 기반으로합니까?
upabove

2
예-각 베타 계수에 대해 승산 비와 95 % 신뢰 한계를 얻을 수 있습니다. 신뢰 구간에 대해 다른 백분위 수 (90 %, 99 % 등)를 계산하지 않으면 1.96이 변경되지 않지만 95 %가 표준이므로 그렇게 할 필요가 없습니다. 그리고 로그 스케일에서 작업하는 한 로지스틱 회귀 모델의 매개 변수는 일반적으로 분포됩니다. 당신이 그들을 지수하면, 이것은 사실이 중지됩니다.
Fomite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.