토론에 새로운 차원을 추가하고 더 일반적으로 만들려고 노력했습니다. 너무 초보적인 경우 실례합니다.
회귀 모형은 통계적 관계의 두 가지 필수 요소를 표현하는 공식적인 수단입니다.
- 와이엑스
- 포인트 산란 통계적 관계의 곡선 주변.
와이
그것을 가정함으로써 :
이 확률 분포와이 각 레벨마다 엑스.
이러한 확률 분포 의 수단은 다음 과 같은 체계적인 방식 으로 다양합니다.엑스.
회귀 모델의 형태와 다를 수 회귀 함수 (직선, 곡선) 에서 의 확률 분포의 형상와이 (대칭, 기울어 짐) 및 다른 방법으로.
변동이 무엇이든, 확률 분포의 개념은와이 어떤 주어진 엑스 통계적 관계에서 경험적 분산에 대한 공식적인 대응이다.
마찬가지로 회귀 곡선 은 확률 분포의 평균 간의 관계를 설명합니다.와이 그리고의 수준 엑스의 일반적인 경향에 대응와이 에 따라 엑스 체계적으로통계적 관계에서 .
출처 : 응용 선형 통계 모형, KNNL
정규 오차 회귀 모형에서 평균의 조건부 분포를 추정하려고합니다. 와이 주어진 엑스 그것은 아래와 같이 쓰여 있습니다 :
와이나는= β0 + β1엑스나는+ ϵ
어디에:
와이나는 관찰 된 반응이다
엑스나는 알려진 상수, 예측 변수 수준
β0 과 β1 매개 변수입니다
ϵ 독립적이다 엔( O , σ2)
나는 = 1, ..., n
따라서 추정 이자형( Y| 엑스) 우리는 다음 세 가지 매개 변수를 추정해야합니다. β0, β1 과 σ2. 우도 함수 wrt의 부분 미분을 취함으로써β0, β1 과 σ2그것들을 0과 동일시합니다. 이것은 정규성을 가정하면 비교적 쉬워집니다.
the residuals of the model are nearly normal,
the variability of the residuals is nearly constant
the residuals are independent, and
each variable is linearly related to the outcome.
1과 2는 어떻게 다릅니 까?
질문에 오기
귀하가 명시한 첫 번째 및 두 번째 가정은 평균이 일정하고 분산이 일정한 정규성 가정의 두 부분입니다. 문제는 두 가정의 차이보다는 정상적인 오류 회귀 모델에 대한 두 가정의 의미로 간주되어야한다고 생각합니다. 나는 당신이 사과를 오렌지와 비교하는 것처럼 보이기 때문에 점의 분포에 대한 가정과 변동성에 대한 가정 사이의 차이를 찾으려고 노력하고 있습니다. 변동성은 분포의 속성입니다. 그래서 저는 두 가정의 의미에 대한보다 관련성있는 질문에 답하려고 노력할 것입니다.
정규성을 가정 할 때 최대 가능성 추정기 (MLE)는 최소 제곱 추정기와 동일하며 MLE은 UMVUE 라는 속성을 즐기므로 모든 추정기 사이에 최소 편차가 있습니다.
균일도 가정으로 매개 변수에 대한 구간 추정치를 설정할 수 있습니다. β0 과 β1그리고 유의성 테스트를합니다. 티-test는 정규성에서 약간의 편차에 대한 통계적 유의성을 확인하는 데 사용됩니다.