내 의견으로는 의견에 아주 좋은 정보가 있습니다. 로지스틱 회귀 분석에 대한 몇 가지 기본 사실이 이러한 것들을 더 이해하기 쉽게 만드는지 궁금합니다. 그런 점을 염두에두고 몇 가지 사항을 말씀 드리겠습니다. 로지스틱 회귀 분석에서 계수는 로지스틱 척도에 있습니다 (따라서 이름은 ...). 관측 값에 대한 공변량 값을 연결하고 계수에 곱한 다음 합하면 logit이 됩니다.
e ≈ 2.718281828 e 2 = 7.389056 7.389056
logit=β0+β1x1+β2x2+...+βkxk
로 짓은 누구에게나 직관적으로 이해되지 않는 숫자이므로 숫자로 무엇을해야하는지 알기가 매우 어렵습니다 (예 : 매우 높거나 낮음). 이러한 것들을 이해하는 가장 좋은 방법은 그것들을 원래 척도 (logits)에서 이해할 수있는 것, 특히 확률로 변환하는 것입니다. 그렇게하려면, 로짓을 가져 가서 지수화하십시오. 즉, 숫자
e ( ) 를 취하여 로짓의 거듭 제곱으로 올립니다. 로짓이 2라고 상상해보십시오.
이것은 당신에게 확률을 줄 것입니다. 확률을 1과 확률로 나누어 확률을 확률로 변환 할 수 있습니다.
사람들은 일반적으로 확률을 다루기가 훨씬 쉽습니다.
e≈2.718281828
e2=7.389056
7.3890561+7.389056=0.880797
모형의 경우 모든 변수의 값이 정확히 0 인 관측치가 있다고 가정하면 모든 계수가 제거되고 절편 값만 남게됩니다. 값을 지수화하면 확률로 0을 얻습니다 (-700이면 확률은 -305 일 것입니다. 그러나 컴퓨터에서 -1060에 대한 값을 줄 수는 없습니다. 내 소프트웨어의 수치 제한으로 인해 너무 작습니다). 이러한 확률을 확률로 변환, ( 0 / ( 1 + 0 )9.8×10−3050/(1+0)), 다시 0을 제공합니다. 따라서 출력에서 말하는 것은 모든 변수가 0 일 때 이벤트 (무엇이든)가 단순히 발생하지 않는다는 것입니다. 이. 표준 로지스틱 회귀 방정식 (예를 들어, 제곱 항이없는)은 공변량과 성공 확률 간의 관계가 단조 증가 또는 단조 감소라고 가정합니다.. 즉, 항상 더 커지고 (또는 더 작아짐), 한 방향으로 충분히 가면 숫자가 작아서 내 컴퓨터가 0과 구별 할 수 없게됩니다. 짐승의 본성. 이와 같이 모델의 경우 공변량이 0 인 곳으로 이동합니다.
계수 0에 관해서는 제안한 것처럼 변수가 영향을 미치지 않는다는 것을 의미합니다. 변수가 효과를 갖지 않는 것이 합리적입니다. 그럼에도 불구하고 기본적으로 정확히 0의 계수를 얻지 못할 것입니다.이 경우 왜 변수가 발생했는지 모르겠습니다. 의견은 몇 가지 가능한 제안을 제공합니다. 다른 변수를 제공 할 수 있습니다. 즉, 해당 변수에 변형이 없을 수 있습니다. 예를 들어, 성별로 코딩 된 변수가 있지만 샘플에 여성 만있는 경우. 그것이 실제 답인지 여부는 알 수 없습니다 (예를 들어 R NA
은 그 경우 반환 하지만 소프트웨어는 다릅니다). 이것은 또 다른 제안 일뿐입니다.