회귀 기의 컨디셔닝과 그것들을 고정 된 것으로 취급하는 것의 차이점은 무엇입니까?


9

때때로 우리는 회귀자가 고정되어 있다고 가정합니다. 즉, 비 확률 적입니다. 내가 생각 하는 방법 우리의 모든 예측은, 매개 변수 추정 등, 마우스 오른쪽 무조건? 더 이상 무작위 변수가 아니도록 지금까지 갈 수 있습니까?

반면에 우리는 경제학의 대부분의 회귀 분석가들이 외부 실험을 염두에두고 결정하지 않았기 때문에 확률 론적이라고 말한다. 그런 다음 계량 경제학자들은이 확률 론적 회귀 분석 도구를 사용합니다.

이것을 고정 된 것으로 취급하는 것과 어떻게 다릅니 까?

나는 컨디셔닝이 무엇인지 이해합니다. 수학적으로, 우리 특정 회귀 분석 세트에 대한 모든 관측과 추론을 조건부로 하고 , 회귀 분석기의 다른 실현을 보았을 때 추론, 모수 추정치, 분산 추정치 등이 같을 것이라는 야망이 없음을 의미합니다. 각 시계열이 한 번만 표시되는 시계열의 요점).

그러나 고정 회귀 분석기 대 확률 론적 회귀 분석기의 조절의 차이를 실제로 이해하기 위해, 여기서 고정 회귀 분석기에는 유효하지만 확률론적일 때 분해되는 추정 또는 추론 절차의 예를 아는 사람이 있는지 궁금합니다. 조건에 따라).

나는 그 예제를 기대하고 있습니다!


2
변수 오류 모델에 익숙하십니까?
robin.datadrivers

안녕하세요 @ robin.datadrivers 아니요 실제로는 아닙니다.
Hirek

1
독립 변수의 측정 오차에 대한 추정치를 조정하도록 특별히 설계된 모델입니다. 확률 론적 회귀 분석기와 동일하지는 않지만 살펴 보는 것이 유용 할 수 있습니다. 또한 일반적으로 설문 조사는 설문 조사에 의해 수집 된 독립 변수에 샘플링 오류가 있다고 가정합니다. 샘플링 오류를 설명하는 모델이있을 수 있습니다.
robin.datadrivers

1
내가 만난 또 다른 생각은 베이지안 모델을 사용하는 것이 었습니다. 베이지안 모형은 회귀자를 사전 분포를 지정하여 무작위로 처리 할 수 ​​있습니다. 일반적으로 이들이 고정으로 취급되는 경우 모수 (계수, 평균, 분산)에 대해서만 사전 분포를 지정하지만 공변량 또는 결과가 누락 된 경우에는 사전 분포를 지정합니다. 더 이상 생각하지 않고 어떻게 구현할 것인지 정확히 알지 못하지만 각 독립 변수에 대해 사전 분포를 지정하는 방법이있을 수 있습니다.
robin.datadrivers

답변:


3

여기에 얇은 얼음에 모르지만, 나 해보자 : 나는 (제발 코멘트!) 느낌이 통계 및 계량 경제학 사이의 주요 차이점은 통계에서 우리가 고정으로 회귀 변수를 고려 따라서 용어 경향이 있다는 것을 디자인 매트릭스 분명히에서 온다 가정하에 해당이고, 실험 설계 우리가 최초로 선택 하고 고정 설명 변수를.

그러나 대부분의 데이터 세트, 대부분의 상황에서 이는 적합하지 않습니다. 우리는 설명 변수를 실제로 관찰하고 있으며, 그 의미에서 응답 변수와 동일한 기반에 있으며, 둘 다 우리의 통제 밖의 임의의 프로세스에 의해 결정됩니다. 고려하여엑스"고정 된"것으로, 발생할 수있는 많은 문제를 고려하지 않기로 결정합니다.

반면 회귀 분석을 확률 론적이라고 생각하면, 계량 경제학자들이하는 경향이 있기 때문에 그러한 문제를 고려하는 모델링의 가능성이 열린다. 우리가 고려하고 모델링에 통합 할 수있는 짧은 문제 목록은 다음과 같습니다.

  • 회귀 분석기의 측정 오류
  • 회귀 변수와 오차항의 상관 관계
  • 회귀 자로 지연된 응답
  • ...

아마도 오늘날의 일보다 훨씬 더 자주 수행되어야합니까?

EDIT 

나는 회귀 자에 대한 컨디셔닝에 대한 논쟁을 좀 더 공식적으로 해결하려고 노력할 것이다. 허락하다(와이,엑스) 랜덤 벡터이고 관심은 회귀에 있습니다 와이 의 위에 엑스여기서 회귀는 조건부 기대를 의미하는 것으로 간주됩니다. 와이 의 위에 엑스. 다중 정규 가정 하에서 선형 함수가 될 것이지만 우리의 주장은 그것에 의존하지 않습니다. 우리는 일반적인 방식으로 조인트 밀도를 고려하여 시작합니다

에프(와이,엑스)=에프(와이엑스)에프(엑스)
그러나 이러한 함수는 알려지지 않았으므로 매개 변수화 된 모델을 사용합니다.
에프(와이,엑스;θ,ψ)=에프θ(와이엑스)에프ψ(엑스)
어디 θ 조건부 분포를 매개 변수화하고 ψ 한계 분포 엑스. 일반 선형 모형에서θ=(β,σ2)그러나 그것은 가정되지 않습니다. 전체 매개 변수 공간(θ,ψ) 이다 Θ×Ψ, 데카르트 곱, 두 매개 변수는 공통점이 없습니다.

이는 통계 실험 (또는 데이터 생성 프로세스, DGP)의 인수 분해로 먼저 해석 될 수 있습니다. 엑스 에 따라 생성됩니다 에프ψ(엑스)두 번째 단계로 와이 조건부 밀도에 따라 생성됩니다 에프θ(와이엑스=엑스). 첫 번째 단계는 다음에 대한 지식을 사용하지 않습니다.θ이는 두 번째 단계에서만 시작됩니다. 통계엑스 부수적이다 θhttps://en.wikipedia.org/wiki/Ancillary_statistic을 참조 하십시오 .

그러나 첫 번째 단계의 결과에 따라 두 번째 단계는 다소 유익한 정보가 될 수 있습니다. θ. 분포가에프ψ(엑스) 분산이 매우 낮습니다. 엑스작은 지역에 집중되므로 추정하기가 더 어려울 것입니다 θ. 따라서이 2 단계 실험의 첫 번째 부분은θ추정 할 수 있습니다. 따라서 조건에 자연스럽게엑스=엑스회귀 모수에 대한 유추. 이것이 조건부 주장이며, 위의 개요는 그 가정을 명확하게합니다.

설계된 실험에서 그 가정은 대부분 관측 데이터와는 달리 대부분 유지 될 것이다. 문제의 예는 예측 변수로 지연된 응답을 사용한 회귀입니다. 이 경우 예측 변수를 조정하면 반응도 조정됩니다! (더 많은 예제를 추가하겠습니다).

이 문제에 대해 자세히 설명하는 한 권의 책은 정보 및 지수 패밀리입니다. O. E Barndorff-Nielsen의 통계 이론 . 특히 4 장을 참조하십시오. 저자는 이 상황에서의 분리 논리는 거의 설명되어 있지 않지만 다음과 같은 참고 자료를 제공 한다고 말합니다 . RA Fisher (1956) 통계 방법 및 과학적 추론 §4.3그리고 Sverdrup (1966) 현재의 의사 결정 이론과 네이 먼-피어슨 이론 .

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.