이 질문에 대한 많은 답변이 있지만 흥미로운 점을 지적한 후에도 여전히 하나를 추가하고 싶습니다. 단순화를 위해 간단한 선형 모델 만 고려합니다.
It is my understanding that the linear regression model
is predicted via a conditional expectation E(Y|X)=b+Xb+e
간단한 선형 회귀 분석의 기본 방정식은 다음과 같습니다.
이 방정식의 의미는 Y 의 평균값이 X 의 값에 대해 선형이라는 것을 의미합니다. 또한 매개 변수 β 0 및 β 1 에서 기대 값이 선형임을 알 수 있습니다.이것이 모델을 선형이라고합니다. 이 기본 방정식과 같이 재 표현 될 수있다 :
Y = β 0 + β 1 X + ε ,
여기서 ε는 제로 평균을 가진 무작위 변수 : E ( ε ) =
전자 (Y|엑스) = β0+ β1엑스,
와이엑스β0β1와이= β0+ β1엑스+ ϵ ,
ϵE (ϵ)=0
Do we assume that both X and Y are Random variables with some unknown
probability distribution? ... If we don't assume the independent variables
are themselves random
독립 변수 는 임의적이거나 고정적 일 수 있습니다. 종속 변수 Y 는 항상 랜덤입니다.엑스Y
일반적으로 이라고 가정합니다 . . . , X n } 은 고정 된 숫자입니다. 이는 회귀 분석이 개발되어 X 의 값이 이전에 고정 된 설계된 실험과 관련하여 광범위하게 적용되기 때문 입니다.{X1,...,Xn}X
과 β 1 의 최소 제곱 추정치에 대한 공식 은 X 가 무작위로 가정 되더라도 동일 하지만 이러한 추정치의 분포는 일반적으로 고정 X 가있는 상황과 비교하여 동일하지 않습니다 .β0β1XX
if we take the conditional expectation E(Y|X=35) ... would we just take
the average(arithmetic mean) of y for those observations where X=35?
φ^(x)E(Y|X=x)β^0β^1
φ^(x)=β^0+β^1x
조건부 평균 최소 제곱 추정기는 모형이 다른 가중치를 단일 요인의 수준으로 처리하는 경우 설명 된 것과 같습니다. 이러한 모델은 일원 분산 분석으로도 알려져 있으며 (단순하지 않은) 선형 모델의 특별한 경우입니다.