계량 경제학과 다른 통계학 분야의 주요 철학, 방법론 및 용어의 차이점은 무엇입니까?


70

계량 경제학은 전통적인 통계와 실질적으로 중복되지만 종종 다양한 주제 ( "식별", "외인성"등)에 대한 자체 전문 용어를 사용합니다. 한 번 다른 용어로 적용된 통계 교수가 용어가 다르지만 개념은 동일하다고 들었습니다. 그러나 그것은 또한 고유의 방법과 철학적 차이를 가지고 있습니다 (Heckman의 유명한 에세이가 떠 오릅니다).

계량 경제학과 주류 통계 사이에는 어떤 용어 차이가 있으며, 용어는 용어 이외의 영역에서 어떻게 다른가?

답변:


96

같은 분야를 다른 학문에서 다른 이름이라고하는 용어적인 차이점이 있습니다.

  1. 생물 통계학에서의 종 방향 데이터는 계량 경제학에서 동일한 개인 = 패널 데이터의 반복 된 관찰이다.
  2. 1의 확률이 1 로 모델링되는 이진 종속 변수의 모형을 계량 경제학에서는 로짓 모형 (logit model), 생물 통계에서는 로지스틱 모형 (logistic model 이라고합니다. 생물 통계 학자들은 가 종종 2 진이기 때문에 확률 비 측면에서 로지스틱 회귀 분석을하는 경향이 있으므로, 확률 비는 모집단에서 두 그룹에 대한 관심 결과의 상대 빈도를 나타냅니다. 이것은 일반적인 해석으로,이 해석을 쉽게하기 위해 연속 변수가 두 가지 범주 (저혈압 대 고혈압)로 변환되는 것을 종종 볼 수 있습니다.x1/(1+exp[xβ])x
  3. 통계학 자의 "추정 방정식"은 계량 경제학자의 "순간 조건"입니다. 통계학 자의 추정치는 계량 경제학자의 극한 추정값입니다.M

동일한 용어가 다른 분야에서 다른 것을 의미하는 데 사용되는 용어상의 차이점이 있습니다.

  1. 고정 효과 는 ANOVA 통계학 자의 회귀 방정식에서 와 계량 경제학자의 "내부"추정치를 나타냅니다.xβ
  2. 강력한 추론은 경제학자에 대한 이분산성 수정 표준 오류 (클러스터 된 표준 오류 및 / 또는 자기 상관 수정 표준 오류로 확장) 및 통계 학자에게 훨씬 더 강력한 방법을 의미합니다.
  3. 경제학자들은 계층화 된 표본이 선택의 확률이 관측에 따라 다르다는 터무니없는 생각을 가지고있는 것으로 보인다. 이를 불균등 확률 샘플이라고합니다. 계층화 된 샘플은 모집단이 샘플링이 발생 하기 전에 알려진 특성에 따라 미리 정의 된 그룹으로 분할 된 샘플입니다.
  4. 계량 경제학자의 "데이터 마이닝"(최소한 1980 년대의 문헌에서)은 Harrell의 저서 에서 훌륭하게 설명 된 여러 테스트와 함정을 의미하는 데 사용되었습니다 . 컴퓨터 과학자 (및 통계 학자) 데이터 마이닝 절차는 통계 학습 이라고도하는 데이터에서 패턴을 찾는 비모수 적 방법입니다 .

계량 경제학의 독특한 공헌은

  1. mpiktas가 또 다른 답변에서 설명했듯이 내 생성과 잘못 지정된 회귀 모델을 다루는 방법 은 (i) 설명 변수 자체가 무작위 일 수 있으며 (따라서 매개 변수 추정치에서 편향을 일으키는 회귀 오류와 상관이 있음), (ii) 모델은 생략 된 변수 (그러면 오류 항의 일부가 됨)를 겪을 수 있습니다. (iii) 경제 에이전트가 자극에 반응하는 방식에 이질성이 관찰되지 않아 표준 회귀 모델이 복잡해질 수 있습니다. Angrist & Pischke 는 이러한 문제에 대한 훌륭한 리뷰이며 통계학자는 회귀 분석을 수행하는 방법에 대해 많은 것을 배울 것입니다. 최소한 통계학자는 도구 변수 회귀를 배우고 이해해야합니다.
  2. 보다 일반적으로, 경제학자들은 그들의 모델이 다변량 정규성만큼 어리석은 것에 얽매이지 않도록 모델에 대해 가능한 적은 가정을하고 싶어합니다. 그렇기 때문에 GMM이 경제학자들에게 큰 인기를 얻었으며 통계에 사로 잡히지 않았습니다 ( 1960 년대 후반 퍼거슨이 최소 로 묘사 했음에도 불구하고 ). 이것이 계량 경제학에서 경험적 가능성의 채택이 기하 급수적으로 증가한 이유는 있지만 통계적으로는 미미한 수준이다. 이것이 경제학자들이 기본 OLS 표준 오류 와 함께 "강력한"표준 오류와 통계학 회귀 분석을 실행하는 이유 입니다.s 2 ( X X ) 1χ2s2(XX)1
  3. 정기적으로 간격을 둔 프로세스로 시간 영역에서 많은 작업이 이루어졌습니다. 바로 거시 경제 데이터가 수집되는 방식입니다. 고유 한 기여에는 통합 및 공동 통합 프로세스 및 자기 회귀 조건부 이분산성 ((G) ARCH) 방법이 포함됩니다. 일반적으로 미성년자이기 때문에 나는 이것에 익숙하지 않습니다.

전반적으로 경제학자들은 모델의 계수에 대한 강력한 해석을 찾는 경향이 있습니다. 통계 학자들은 종종 단순한 예측 장치로서 긍정적 인 결과의 확률을 얻는 방법으로 로지스틱 모델을 사용하고, 또한 소유 한 멋진 지수 가족 속성과 판별 분석과의 연결을 통해 GLM 해석을 주목할 수 있습니다. 경제학자들은 로짓 모델의 유틸리티 해석에 대해 생각 하고이 모델에서 만 식별되며 이분산성이 그것을 버릴 수 있다고 우려합니다. (통계 학자들은 궁금해 할 것입니다.σβ/σσ 물론 입력에 선형 인 유틸리티는 Microeconomics 101의 관점에서 볼 때 매우 재미있는 일이지만 반 오목 함수에 대한 일부 일반화는 Mas-Collel에서 수행 될 수 있습니다.

경제학자들이 일반적으로 놓치기 쉬운 경향이 있지만 IMHO가 얻는 이점은 다변량 분석의 측면입니다 (측정 오류 및 여러 프록시를 처리하는 방법으로 잠재 변수 모델 포함 ... 통계학 자도 이러한 모델에 대해 분명하지 않습니다) 회귀 진단 (이 모든 Cook 거리, Mallows 'Cp, DFBETA 등), 누락 된 데이터 분석 (Manski의 부분 식별은 확실히 훌륭하지만 주류 MCAR / MAR / NMAR 분석 및 다중 대치가 더 유용합니다) 및 조사 통계. 주류 통계에 의한 많은 다른 기여는 계량 경제학에 의해 접목되었으며 표준 방법론으로 채택되거나 단기 패션으로 전달되었습니다. 1960 년대의 ARMA 모델은 통계학보다 계량 경제학에서 일부 대학원 프로그램으로 더 잘 알려져있을 것입니다 통계에서 요즘 시계열 과정을 제공하지 못할 수도 있습니다. 1970 년대의 수축량 추정기 / 릿지 회귀가왔다 갔다했다; 경제학자들은 부트 스트랩의 한계를 더 잘 알고 있어야하지만, 1980 년대의 부트 스트랩은 복잡한 상황에 대한 무질서한 반응 이다.; 1990 년대의 경험적 가능성은 이론적 통계 학자보다 이론적 계량 경제학자의 방법론 개발이 더 많았다. 2000 년대의 전산 베이지안 방법이 계량 경제학에 접어 들고 있지만 필자의 느낌은 앞에서 언급 한 견고성 패러다임과 호환 되기에는 너무 매개 변수 적이며 모델에 비해 너무 무겁다는 느낌입니다. 경제학자들이 통계 학습 / 생물 정보학 또는 현대 통계학에서 극도로 뜨거운 시공간적 요소를 사용할 수 있는지 여부는 공개적이다.


14
+1 이것은 다양한 커뮤니티에 질문이있을 때 큰 답변이 나타날 수있는 훌륭한 예입니다 .
whuber

1
@ whuber, 의견 주셔서 감사합니다. 징계는 솔직히 저를 견인합니다.
StasK

@StasK 훌륭한 답변입니다. 하지만 한 가지 빠른 점입니다. "전체적으로 경제학자들은 모델의 계수에 대한 강력한 해석을 찾는 경향이 있습니다." 엄밀히 말하면, 이것은 VAR 분석 (매우 널리 사용되므로 귀하의 진술이 "전체적으로"언급되지 않아야 함) 때문에 중심점은 모델의 계수를 해석하는 대신 임펄스 응답 함수를 해석하는 데 있기 때문에 약간 잘못되었습니다 (종종) 해석하기에는 너무 복잡합니다).
Graeme Walsh

@GraemeWalsh-말했듯이 매크로 / 시계열에서는 작동하지 않습니다. 이것을 지적 해 주셔서 감사합니다.
StasK

20

그것이 계량 경제학의 주요 도구이기 때문에 선형 회귀에 관해 설명하는 것이 가장 좋습니다. 선형 회귀 분석에는 다음과 같은 모델이 있습니다.

Y=Xβ+ε

다른 통계 필드와 계량 경제학의 주요 차이점은 는 다른 필드에서 고정 된 것으로 취급되고 계량 경제학에서 랜덤 변수로 처리 된다는 것 입니다. 이 차이를 조정하기 위해 추가로주의를 기울이면 다른 전문 용어와 다른 방법이 만들어집니다. 일반적으로 계량 경제학에 사용 된 모든 방법은 설명 변수의 임의성을 조정하는 다른 통계 필드와 동일한 방법이라고 말할 수 있습니다. 주목할만한 예외는 독특한 계량 도구 인 GMM 입니다.X

차이를 보는 또 다른 방법은 다른 통계 필드의 데이터를 iid 샘플로 간주 할 수 있다는 것입니다. 계량 경제학에서 많은 경우의 데이터는 확률 론적 과정의 표본이며, iid는 특별한 경우입니다. 따라서 또 다른 전문 용어.

위의 내용을 알면 일반적으로 다른 통계 필드에서 계량 경제학으로 쉽게 이동할 수 있습니다. 일반적으로 모델이 주어지기 때문에 무엇이 무엇인지 알아내는 것은 어렵지 않습니다. 개인적으로 머신 러닝과 고전 통계의 전문 용어 차이는 계량 경제학과 고전 통계 사이의 차이보다 훨씬 큽니다.

그러나 계량 경제학이없는 통계에서는 의미가 복잡한 용어가 있습니다. 주요 예는 고정 및 임의 효과입니다. 이 용어에 관한 Wikipedia 기사는 계량 경제학과 통계를 혼합 한 혼란입니다.


5
"주요한 예는 고정적이고 무작위 효과입니다.이 용어에 관한 Wikipedia 기사는 계량 경제학과 통계를 혼합 한 혼란입니다." 그렇습니다.
Michael Bishop

8

미묘한 차이점 중 하나는 경제학자들이 때때로 모델의 오차항에 의미를 부여한다는 것입니다. 이것은 관심 또는 개별 이질성을 나타내는 구조적 매개 변수를 추정 할 수 있다고 믿는 "구조적"경제학자에게 특히 해당됩니다.

이것의 클래스 예는 프로 빗입니다. 통계 학자들은 일반적으로 오류 항의 원인에 대해 불가지론 적이지만 경제학자들은 회귀 분석에서 오류 항을 선호도의 이질성을 나타내는 것으로 종종 본다. 프로 빗 사례의 경우 여성이 노동력에 가입하기로 한 결정을 모델링 할 수 있습니다. 이것은 다양한 변수에 의해 결정되지만, 오류 용어는 작업에 대한 개별 선호도가 변할 수있는 관찰되지 않은 정도를 나타냅니다.


4
통계 학자들이 오류 항의 원인에 대해 무의식적 일 수 있지만, 그것이 그 용어에 관심이 없다는 것을 의미하지는 않습니다. 설명하는 것은 오류 항의 이질성이며, 이는 오류 항에 대한 일반적인 가정이 충족되지 않음을 의미합니다. 어떤 통계학 자도이를 무시하지 않을 것입니다.
mpiktas

2
흥미롭게도,이 경우 오류 항의 형태에는 문제가 없습니다. 통계 학자와 경제학자 모두 무기를 들고 이분산성 또는 다른 비 -IID 오류 항에 대해 걱정할 것입니다. 그러나 오류 조건이 probit에서와 같이 N (0,1)이더라도, 경제학자들은 경제적 인 해석을하기 쉽다.
d_a_c321

5
그것은 일반적으로 모델링에 적용됩니다. 자신의 특별한 방식으로 모델을 해석하는 것은 저의 경험이있는 한 경제학자에게만 국한되지 않습니다.
mpiktas

동의하지 않습니다. 경제학자들은 <단순 농담!> 모델의 영리한 해석에 대한 독점권을 가지고 있습니다. 그래도 좋은 지적입니다.
d_a_c321

8

물론, 광범위한 진술은 지나치게 광범위해야한다. 그러나 나의 경험은 계량 경제학이 인과 관계에 관심이 있고 통계가 예측에 더 관심을 갖게되었다는 것이다.

경제 측면에서는 "신뢰도 혁명"문헌 ( 주로 무해한 계량 경제학 등)을 피할 수 없습니다 . 경제학자들은 일부 평가가 정책 평가 및 권고를 향해 일부 결과에 미치는 영향에 중점을 둡니다.

통계 측면에서는 온라인 분석 및 유전학에 대한 응용 프로그램이 주목할만한 데이터 마이닝 / 머신 학습의 부상을 볼 수 있습니다. 여기에서 연구원들은 행동이나 관계를 정확하게 설명하기보다는 예측하는 데 더 관심이 있습니다. 원인이 아닌 패턴을 찾습니다.

또한 통계 학자들은 전통적으로 실험 설계에 더 관심이 있었고 1930 년대의 농업 실험으로 되돌아갔습니다.


7

필자가 주류 통계 과학 계량 경제학자와 비교할 때 회로도 또는 데이터 기반 그래프를 사용하는 것을 꺼려하는 것으로 나타났습니다. 다른 곳보다 계량 경제학의 중심에있는 회귀의 적용 범위가 중요한 예입니다. 통계학 자의 회귀에 대한 현대의 소개는 데이터를 도표화하고 진단 도표를 포함하여 회귀 결과를 도표화하는 가치를 강조하지만 계량 경제학 텍스트에서의 처리는 분명히 더 공식적입니다. 계량 경제학의 주요 텍스트는 많은 그래프를 포함하지 않으며 그 가치를 강력하게 홍보하지 않습니다.

외교적이거나 나빠질 위험없이 이것을 분석하기는 어렵지만, 다음과 같은 조합을 기여한 것으로 추측합니다.

  1. rigour에 ​​대한 욕망. 계량 경제학자들은 데이터로부터 배우는 것에 대해 의심 스럽거나 적대적인 경향이 있으며 공식적인 시험에 근거한 결정을 강력히 선호합니다 (정리에서 나오지 않을 때마다). 이것은 모델이 "이론"을 기반으로하는 선호와 연결되어 있습니다 (그러나 이것은 예측자가 일부 경제학자에 의해 데이터에 대해 언급하지 않은 논문에서 이미 언급되었다는 것을 의미 할 수 있습니다).

  2. 출판 관행. 경제학 또는 계량 경제학 저널에 대한 논문은 고도로 양식화 된 계수, 표준 오류, t- 통계량 및 P- 값 테이블로 무겁습니다. 그래프를 추가하는 것은 많은 경우에 대해 생각되지 않는 것 같으며 제공된 경우 검토자가 절단을 제안 할 수 있습니다. 이러한 관행은 중요성 수준 등에 대한 엄격한 규칙 등을 통해 자동으로 구현되는 한 세대 이상에 걸쳐 내장되었습니다.

  3. 복잡한 모델을위한 그래픽. 암묵적으로 그래프는 예측 변수 등이 많은 복잡한 모델과 일치하는 그래프가있는 것처럼 보이지 않을 때마다 무시됩니다 (실제로 결정하기 어려운 경우).

당연히, 내가 제안하는 것은 그대로 의미의 차이이며 두 경우 모두에서 많은 변화를 인식합니다.


4

대부분의 다른 정량적 학문과 달리 경제학은 MARGIN의 사안을 처리합니다. 즉, 한계 효용, 한계 대체율 등. 미적분학 용어에서 경제학은 "제 1"(및 고차 파생 상품)을 다룬다.

많은 통계 분야는 평균 및 분산과 같은 비 파생 수량을 처리합니다. 물론 한계 및 조건부 확률 분포 영역으로 이동할 수 있지만 이러한 응용 프로그램 중 일부는 경제학에도 적용됩니다 (예 : "예상 값").


2

계량 경제학이 아니라 맥락입니다. 우도 함수에 고유 한 최적 값이 없으면 통계 학자와 계량 경제학자 모두와 관련이 있습니다. 이제 경제 이론에서 나온 가정을 제안하고 매개 변수가 식별되도록 매개 변수화를 제한하는 경우 계량 경제학 (econometrics)이라고 할 수 있지만 가정은 모든 실질적인 분야에서 나올 수 있습니다.

외 생성은 철학적 문제입니다. 경제학자들이 루빈과 같은 방식으로 이해하는 다른 견해를 비교하려면 http://andrewgelman.com/2009/07/disputes_about/ 을 참조하십시오 .

즉, 교사가 사용하는 전문 용어를 채택하거나 열린 마음을 유지하고 널리 읽습니다.


2

계량 경제학자는 인과 적 추론에 거의 독점적으로 관심이있는 반면 통계학자는 결과 예측에 모델을 사용합니다. 결과적으로 계량 경제학자들은 다른 사람들이 언급했듯이 외 생성에 더 초점을 둔다. 축소 된 계량 경제학자와 구조적 계량 경제학자는이 인과 관계 해석을 다른 방식으로 얻습니다.

줄어든 형태의 계량 경제학자는 도구 변수 기법을 사용하여 외 생성을 다루는 경우가 많습니다 (IV는 통계학자가 훨씬 덜 자주 사용합니다).

구조 경제학자는 통계학자가보기 어려운 이론에 의존하여 매개 변수에 대한 인과적인 해석을 얻습니다.


1
IV는 비 통계 학자들이 많이 사용하며 축소 형 계량 경제학은 IV 이외의 인과 추론에 많은 기법을 사용합니다 (diff-in diiff, regression discontinuity 등). 최근의 비 경제적 통계 IV 개발과 계량 경제학 IV의 조정 에 대해서는 Imbens의이 논문을 참조하십시오 .
Ari B. Friedman

2

통계 학자로서 나는 이것을 더 일반적인 용어로 생각합니다. 우리는 생체 인식과 계량 경제학을 가지고 있습니다. 이들은 통계를 사용하여 문제를 해결하는 영역입니다. 생체 인식을 사용하면 생물학적 / 의료 문제를 처리하는 반면, 계량 측정은 경제학을 처리합니다. 그렇지 않으면 다른 분야가 다른 통계 기술을 강조한다는 점을 제외하고는 동일합니다. 생체 인식에서 생존 분석 및 비상 대피 표 분석이 많이 사용됩니다. 계량 경제학의 경우 시계열이 많이 사용됩니다. 회귀 분석은 둘 다 공통입니다. economatrics와 biostatistics 사이의 용어 차이에 대한 답을 보았을 때 실제 질문은 주로 용어에 관한 것으로 보였고 실제로 다른 두 가지에 대해서만 다루었습니다. 대답은 너무 좋아서 아무것도 추가 할 수 없습니다. StasK의 답변이 특히 마음에 들었습니다. 그러나 생물 통계 학자로서 우리는 로짓 모델과 로지스틱 모델을 서로 바꿔 사용할 수 있다고 생각합니다. logit 변환을 log (p / [1-p])라고합니다.


2
(+1) 도메인 별 문제에 적용된 통계의 도메인 별 응용 프로그램 목록에 심리 측정 을 추가 할 수 있습니다 .
Andy W
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.