그레이 밴드는 회귀선에 대한 신뢰 밴드입니다. 나는 ggplot2에 대해 1 SE 신뢰 밴드인지 95 % 신뢰 밴드인지 확실하게 알지 못하지만, 그것이 전자의 신뢰 밴드 라고 생각합니다 ( 편집 : 분명히 95 % CI ). 신뢰 구간은 회귀선에 대한 불확실성을 나타냅니다. 어떤 의미에서, 실제 회귀선은 해당 밴드의 상단만큼 높거나, 하단만큼 낮거나, 밴드 내에서 다르게 흔들린다 고 생각할 수 있습니다. (이 설명은 직관적 인 것으로 의도 된 것이며 기술적으로 정확하지는 않지만 대부분의 사람들이 완전히 설명하기는 어렵습니다.)
회귀선을 이해 / 생각하는 데 도움이되도록 신뢰 구간을 사용해야합니다. 원시 데이터 포인트에 대해 생각할 때 사용해서는 안됩니다. 회귀선 은 X의 각 지점에서 의 평균을 나타냅니다 (이를 더 완전히 이해해야하는 경우 여기에서 내 대답을 읽는 데 도움이 될 수 있습니다 . 조건부 가우스 분포의 직관은 무엇입니까? ). 반면에, 관측 된 모든 데이터 포인트가 조건 평균과 같을 것으로 예상하지는 않습니다. 즉, 데이터 포인트가 특이 치인지 여부를 평가하기 위해 신뢰 구간을 사용해서는 안됩니다. 와이엑스
( 편집 :이 메모는 주요 질문의 주변이지만 OP의 요점을 명확히하려고합니다. )
다항식 회귀는 직선 모양이 아니더라도 비선형 회귀가 아닙니다. '선형 (linear)'이라는 용어는 수학적 상황에서 매우 구체적인 의미를 지닙니다. 구체적으로, 추정하는 매개 변수 (베타)는 모든 계수라는 것입니다. 다항식 회귀는 공변량이 , X 2 , X 3 등임을 의미합니다 . 즉, 서로 비선형 관계를 가지고 있지만 베타는 여전히 계수이므로 여전히 선형 모델입니다. 베타가 지수 인 경우 비선형 모델이됩니다. 엑스엑스2엑스삼
요약하면 선이 직선으로 보이는지 여부는 모형이 선형인지 여부와 관련이 없습니다. 다항식 모형을 적합 할 때 (예 : 엑스 및 )에 적합하면 모델은 예를 들어 X 2 가 실제로 X 1 의 제곱 이라는 것을 알지 못합니다 . 이것들은 단지 두 개의 변수 일 뿐이다 (다중 선형성이 있다는 것을 인식 할 수는 있지만). 따라서, 진정으로 그것이 (직진 / 평) 회귀 피팅 평면을 삼차원 공간 아닌 (곡선) 회귀의 라인 이차원 공간이다. 이것은 우리가 X 2 이후로 생각하기에 실제로 유용하지 않으며, 실제로보기가 매우 어렵습니다.엑스2엑스2엑스1엑스2 의 완벽한 기능입니다 . 결과적으로 우리는 이런 식으로 생각하지 않으며 플롯은 실제로 ( X , Y ) 평면 에 대한 2 차원 투영 입니다. 그럼에도 불구하고, 적절한 공간에서 선은 실제로 어떤 의미에서 '직선'입니다. 엑스( X, Y )
수학적 관점에서, 추정하려는 모수가 계수 인 경우 모형은 선형입니다. 더 명확하게하기 위해 표준 (OLS) 선형 회귀 모델과 두 가지 다른 형태로 제시된 간단한 로지스틱 회귀 모델 간의 비교를 고려하십시오.
ln ( π ( Y )
와이= β0+ β1엑스+ ε
ln( π( Y)1 − π( Y)) = β0+ β1엑스
π( Y) = exp( β0+ β1엑스)1 + 특급( β0+ β1엑스)
βββ로짓과 프로 빗 모델의 차이점 .)