회귀 평균 차이에 대한 신뢰 구간


10

이차 회귀 모형이 있다고 가정합니다.

Y=β0+β1X+β2X2+ϵ
오류는 이 일반적인 가정을 만족시킨다 (독립, 정상, 값 과 무관 ). 하자 최소 제곱 추정합니다.ϵXb0,b1,b2

두 개의 새로운 값 과 가 있고 대한 신뢰 구간을 얻는 데 관심이 있습니다 .Xx1x2v=E(Y|X=x2)E(Y|X=x1)=β1(x2x1)+β2(x22x12)

점 추정치는 이고 (잘못되면 수정) 분산을 추정 할 수 있습니다 는 소프트웨어에서 제공 한 계수의 분산 및 공분산 추정을 사용합니다.v^=b1(x2x1)+b2(x22x12)

s^2=(x2x1)2Var(b1)+(x22x12)2Var(b2)+2(x2x1)(x2x12)Cov(b1,b2)

나는 정상적인 근사치를 사용 걸릴 수 있습니다 에 대한 95 % 신뢰 구간으로 또는 I는 부트 스트랩 신뢰 구간을 사용할 수 있지만 작업 할 수있는 방법은 정확한 유통에서가 그리고 그것을 사용합니까?V^±1.96에스^V


2
오차는 정상으로 가정되기 때문에, 오차의 경우에도 데이터의 선형 함수 인 매개 변수 추정치 자체는 정상이어야하며 이는 의 정규 분포를 의미합니다 . V^
whuber

정규 신뢰 구간이 정확하다고 말하는가? 내가 올바르게 이해한다면, 그 논리에 의해 우리는 또한 매개 변수에 대해 일반적인 신뢰 구간을 사용합니다. 그러나 우리는 t 분포에 기초한 구간을 사용합니다.
mark999

오차 분산을 추정하기 때문에 t 분포가 사용됩니다. 그것이 알려진 경우 @whuber와 같은 정규 분포가 있습니다.
JMS

귀하의 의견에 감사드립니다. 내가 묻는 것은 질문에 정의 된대로 v에 대한 신뢰 구간에 t 분포를 사용할 수 있습니까? 그렇다면 얼마나 많은 자유 도로 사용할 수 있습니까?
mark999

분산과 공분산은 모두 잔차의 추정 분산에 따라 달라집니다. 따라서 사용할 DF는이 추정값의 DF이며, 데이터 값 수에서 매개 변수 수에서 상수를 뺀 값과 같습니다.
whuber

답변:


9

찾고있는 일반적인 결과는 다음과 같습니다. p 예측 변수 (두 개가 있고 XX2) 및 가로 채기 n 관찰, 엑스 그만큼 ×(+1) 디자인 매트릭스, β^ 그만큼 +1 치수 추정기 및 아르 자형+1

β^βσ^(엑스엑스)11.

결과적으로 모든 선형 조합에 대한 신뢰 구간을 구성 할 수 있습니다. β 같은 것을 사용하여 벡터 -분포를 사용하여 좌표 중 하나에 대한 신뢰 구간을 구성합니다.

귀하의 경우 =2=(0,엑스2엑스1,엑스22엑스12). 위 공식의 분모는 표준 오류의 추정치로 계산 한 것의 제곱근입니다 (소프트웨어가 계산하는 것이라면 ...). 분산 추정기,σ^2, (평소) 편견이 아닌 추정량으로 가정합니다. 여기서 자유 도로 나눕니다. 1, 관측치 수가 아님 .


1
고마워요. 정확히 내가 찾던 것입니다. 그러나 수식에 실수가 있습니까? 치수가 일치하지 않는 것 같습니다(엑스엑스)1. 할까요엑스 ~이다 ×(+1)첫 번째 열에 행렬이 있습니까?
mark999

@ mark999, 예, 엑스 있다 +1열. 나는 대답에서 그것을 고쳤다. 감사.
NRH
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.