대상 변수에서 0과 1을 완벽하게 분리하는 변수가있는 경우 R은 다음과 같은 "완벽 또는 준 완벽 분리"경고 메시지를 생성합니다. Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred 우리는 여전히 모델을 얻지 만 계수 추정치는 팽창됩니다. 실제로 이것을 어떻게 처리합니까?
저는 20 : 1의 경험 법칙 (총 7 개의 후보 예측 변수에 대해 상당히 큰 표본 (N = 374))을 고려하여 적절한 표본을 가지고 있다고 생각합니다. 내 문제는 다음과 같습니다. 내가 사용하는 예측 변수 집합에 관계없이 분류는 100 %의 특이도 및 0 %의 감도보다 나아지지 않습니다. 그러나 불만족 스럽지만 후보 예측 …
이진 로지스틱 회귀 모델의 수작업으로 곡선 아래 면적 (AUC) 또는 c- 통계량을 계산하는 데 관심이 있습니다. 예를 들어, 유효성 검사 데이터 집합에서 종속 변수에 대한 실제 값, 보존 (1 = 유지; 0 = 유지되지 않음)은 다음과 같은 모형을 사용하여 회귀 분석에 의해 생성 된 각 관측치의 예측 보존 상태를 갖습니다. …
선형 회귀 분석의 경우 진단 그림 (잔류 그림, 정규 QQ 그림 등)을 확인하여 선형 회귀 가정이 위반되었는지 확인할 수 있습니다. 로지스틱 회귀 분석의 경우 로지스틱 회귀 모델 적합을 진단하는 방법을 설명하는 리소스를 찾는 데 문제가 있습니다. GLM에 대한 몇 가지 교육 과정 노트를 살펴보면 잔차를 확인하는 것이 로지스틱 회귀 적합에 …
Andrew Ng의 기계 학습 과정 에서 선형 회귀 및 로지스틱 회귀를 소개하고 경사 하강 및 뉴턴의 방법을 사용하여 모형 매개 변수를 맞추는 방법을 보여줍니다. 그래디언트 디센트는 기계 학습의 일부 응용 프로그램 (예 : 역 전파)에 유용 할 수 있지만 더 일반적인 경우 닫힌 형태의 매개 변수를 풀지 못하는 이유가 있습니다. …
'링크 기능'과 '정식 링크 기능'이라는 용어의 차이점은 무엇입니까? 또한, 하나를 다른 것보다 사용하는 (이론적) 장점이 있습니까? 예를 들어, 이진 응답 변수는 logit , probit 등과 같은 많은 링크 함수를 사용하여 모델링 할 수 있습니다 . 그러나 여기서 logit 은 "정식"링크 함수로 간주됩니다.
MNIST 데이터 세트의 모든 이미지가 비슷한 스케일로 중심을 맞추고 회전하지 않고 위로 향하더라도 선형 모델이 이러한 높은 분류 정확도를 달성하는 방법을 의아해하는 중요한 필기 변형이 있습니다. 내가 볼 수있는 한, 상당한 필기 변형을 고려할 때, 숫자는 784 차원 공간에서 선형으로 분리 할 수 없어야합니다. 즉, 서로 다른 숫자를 분리하는 약간 …
이 질문에 답하면서 John Christie는 로지스틱 회귀 모형의 적합도를 잔차를 평가하여 평가해야한다고 제안했습니다. OLS의 잔차를 해석하는 방법에 익숙합니다. DV와 같은 척도에 있으며 모형에서 예측 한 y와 y의 차이가 매우 명확합니다. 그러나 로지스틱 회귀 분석의 경우 과거에는 로지스틱 회귀 분석에서 잔차가 무엇을 의미하는지 알지 못했기 때문에 일반적으로 AIC와 같은 모형 적합도 …
50 개의 연속 설명 변수를 사용하여 이진 결과를 예측하려고합니다 (대부분의 변수 범위는 ~ ). 내 데이터 세트에는 거의 24,000 개의 행이 있습니다. 내가 실행하면 R에, 내가 얻을 :−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred 완벽한 분리가 발생할 수 있음을 …
내가 로지스틱 회귀와 관련하여 Wald 검정을 이해하는 한 특정 예측 변수 가 유의 한지 여부를 결정하는 데 사용됩니다 . 해당 계수의 귀무 가설이 0임을 거부합니다.엑스XX 테스트는 계수 값을 표준 오차 로 나누는 것으로 구성됩니다 .σσ\sigma 내가 혼란스러워하는 것은 가 Z 점수로도 알려져 있으며 주어진 관측치가 정규 분포 (평균 0)에서 발생할 …