여기에 얇은 얼음에 모르지만, 나 해보자 : 나는 (제발 코멘트!) 느낌이 통계 및 계량 경제학 사이의 주요 차이점은 통계에서 우리가 고정으로 회귀 변수를 고려 따라서 용어 경향이 있다는 것을 디자인 매트릭스 분명히에서 온다 가정하에 해당이고, 실험 설계 우리가 최초로 선택 하고 고정 설명 변수를.
그러나 대부분의 데이터 세트, 대부분의 상황에서 이는 적합하지 않습니다. 우리는 설명 변수를 실제로 관찰하고 있으며, 그 의미에서 응답 변수와 동일한 기반에 있으며, 둘 다 우리의 통제 밖의 임의의 프로세스에 의해 결정됩니다. 고려하여엑스"고정 된"것으로, 발생할 수있는 많은 문제를 고려하지 않기로 결정합니다.
반면 회귀 분석을 확률 론적이라고 생각하면, 계량 경제학자들이하는 경향이 있기 때문에 그러한 문제를 고려하는 모델링의 가능성이 열린다. 우리가 고려하고 모델링에 통합 할 수있는 짧은 문제 목록은 다음과 같습니다.
- 회귀 분석기의 측정 오류
- 회귀 변수와 오차항의 상관 관계
- 회귀 자로 지연된 응답
- ...
아마도 오늘날의 일보다 훨씬 더 자주 수행되어야합니까?
EDIT
나는 회귀 자에 대한 컨디셔닝에 대한 논쟁을 좀 더 공식적으로 해결하려고 노력할 것이다. 허락하다( Y, X) 랜덤 벡터이고 관심은 회귀에 있습니다 와이 의 위에 엑스여기서 회귀는 조건부 기대를 의미하는 것으로 간주됩니다. 와이 의 위에 엑스. 다중 정규 가정 하에서 선형 함수가 될 것이지만 우리의 주장은 그것에 의존하지 않습니다. 우리는 일반적인 방식으로 조인트 밀도를 고려하여 시작합니다
에프( y, x ) = f( y∣ x ) f( x )
그러나 이러한 함수는 알려지지 않았으므로 매개 변수화 된 모델을 사용합니다.
에프( y, X ; θ , ψ ) =에프θ( y∣ x )에프ψ( x )
어디 θ 조건부 분포를 매개 변수화하고 ψ 한계 분포 엑스. 일반 선형 모형에서θ = ( β,σ2)그러나 그것은 가정되지 않습니다. 전체 매개 변수 공간( θ , ψ ) 이다 Θ × Ψ, 데카르트 곱, 두 매개 변수는 공통점이 없습니다.
이는 통계 실험 (또는 데이터 생성 프로세스, DGP)의 인수 분해로 먼저 해석 될 수 있습니다. 엑스 에 따라 생성됩니다 에프ψ( x )두 번째 단계로 와이 조건부 밀도에 따라 생성됩니다 에프θ( y∣ X= x ). 첫 번째 단계는 다음에 대한 지식을 사용하지 않습니다.θ이는 두 번째 단계에서만 시작됩니다. 통계엑스 부수적이다 θhttps://en.wikipedia.org/wiki/Ancillary_statistic을 참조 하십시오 .
그러나 첫 번째 단계의 결과에 따라 두 번째 단계는 다소 유익한 정보가 될 수 있습니다. θ. 분포가에프ψ( x ) 분산이 매우 낮습니다. 엑스작은 지역에 집중되므로 추정하기가 더 어려울 것입니다 θ. 따라서이 2 단계 실험의 첫 번째 부분은θ추정 할 수 있습니다. 따라서 조건에 자연스럽게엑스= x회귀 모수에 대한 유추. 이것이 조건부 주장이며, 위의 개요는 그 가정을 명확하게합니다.
설계된 실험에서 그 가정은 대부분 관측 데이터와는 달리 대부분 유지 될 것이다. 문제의 예는 예측 변수로 지연된 응답을 사용한 회귀입니다. 이 경우 예측 변수를 조정하면 반응도 조정됩니다! (더 많은 예제를 추가하겠습니다).
이 문제에 대해 자세히 설명하는 한 권의 책은 정보 및 지수 패밀리입니다. O. E Barndorff-Nielsen의 통계 이론 . 특히 4 장을 참조하십시오. 저자는 이 상황에서의 분리 논리는 거의 설명되어 있지 않지만 다음과 같은 참고 자료를 제공 한다고 말합니다 . RA Fisher (1956) 통계 방법 및 과학적 추론 § 4.3그리고 Sverdrup (1966) 현재의 의사 결정 이론과 네이 먼-피어슨 이론 .