전체 인구에 대한 회귀

전체 모집단이 포함 된 회귀 분석에서 계수의 표준 오차의 의미는 무엇입니까?

나는이 질문에 너무 당황했습니다. 그것은 전체 인구가 포함 된 경우 표준 오차는 의미가 없습니다. 이미 전체 인구가 있으므로 통계적 추론이 필요하지 않습니다.

그러나 그것은 최고 저널에 출판 된 많은 기사들조차도 그렇게 널리 사용됩니다. 예를 들어, 국가의 GDP 성장률과 인구 밀도 사이의 관계를 조사하는 경우 회귀 분석을 실행합니다.

G D P_{i} = α + β P o p_{i} + γ X_{i} + ϵ_{i}

$GDP_i = \alpha + \beta Pop_i + \gamma \mathbf{X}_i + \epsilon_i$

지구상에 195 개국이 있습니다. 이 경우 모든 국가 (인구)가 포함됩니다. 그러나 모든 문헌은 여전히 계수의 통계적 중요성에 대해 이야기합니다.

전체 인구에 대해 회귀 분석 할 때 통계적 추론이 잘못 사용되었다고 누군가 설명 할 수 있습니까?

econometrics regression

— 오사와 아키라
소스

이 질문은 통계 네트워크에서 답변되었습니다. 여기를 참조 하십시오 . 기본적으로 통계는 관련이 없습니다. "회귀"는 순수한 수학적 장치입니다.

— luchonacho

@luchonacho 내 의견은이 질문은 우리가 자연스럽게 stats.SE와 겹치는 내용과 관련하여 여기에 주제라는 것입니다. 나는 그것이 본질적으로 복제품이라는 것에 동의합니다. 여기 크로스 사이트로 무엇을해야하는지에 대한 논의를 복제 발견 meta.stackexchange.com/questions/172307/...

— jmbejara을

@jmbejara 참조 해 주셔서 감사합니다. 알아 둘만 한.

— luchonacho

이것은 또 다른 적절한 참조처럼 보입니다. Athey Imbens (2017)에서 논의 된 무작위 배정이라는 관련 기술에 대해 설명합니다. jasonkerwin.com/nonparibus/2017/09/25/…

— jmbejara

답변:

처음에 중재자가이 질문에 플래그를 지정하여 통계 SE 사이트 Cross Validated로 마이그레이션하는 것이 더 나은지 여부를 조사했습니다. 그러나 OP가 매우 구체적인 계량 경제학 예제를 도입했기 때문에이 예제의 목적을 위해 "매우 깊은" "인구 / 샘플"개념을 유용하게 논의 할 수 있다고 생각합니다.

첫 번째 문제 는 @AdamBailey의 답변에서 논의 된 것입니다. 특정 연도 또는 수년 동안 "세계의 모든 국가"를 고려하고 데이터를 "인구"로 표시하면 다음 해에는 다른 인구에 속해야합니다. 그것이 다른 집단에 속한다면, 어떻게 다른 집단에 대한 추론을하기 위해 한 집단의 결과를 어떻게 사용할 것인가? 실제로, 여기서 우리의 "인구"는 2 차원 적 , 국가 및 기간이며, 그런 의미에서, 개방 된 시간 지평과 함께, 우리는 단지 손에 샘플을 가지고 있습니다.

$GDP_i, i=1,..n$

따라서 우리의 데이터는 이러한 임의 변수의 가능한 결합 구현 중 하나 일뿐입니다. 이러한 실현은 결정 론적 / 엔지니어링 관계 / 인과성 (계수에 반영됨)의 결과뿐만 아니라 본질적으로 임의의 요인의 영향으로 발생했습니다. 그런 의미에서 데이터는 "인구"의 "순수 / 일반"이미지가 아닙니다. 여기에는 노이즈, 비 구조적 장애, 일회성 충격 등이 포함됩니다.

그런 다음이 불확실성은 우리가 추정하려는 계수의 추정으로 이어질 것입니다. 왜냐하면 이러한 계수는 종속 변수의 최종 값에 영향을 미치는 임의의 요소 이전의 인과 관계 또는 이동을 설명한다고 가정하기 때문입니다.

위의 두 가지 측면으로 인해이 경우에도 "추정치의 표준 오차"에 대해 말하는 것이 전적으로 유효하며 평소대로 통계 테스트를 적용합니다.

— 알레 코스 파파도풀로스
소스

추론이 도출되는 인구가 정확히 무엇인지 고려하는 것이 중요합니다. 이 맥락에서 시간 측면을 간과하기 쉽습니다.

예를 들어 목표가 세계 각국의 향후 2 년간 GDP를 예측하는 것이라고 가정합니다. 그런 다음 관심 인구는 "국가, 연도"형식의 쌍 세트입니다. 단순히 "모든 국가"가 아니며 각 국가의 현재 및 지난 몇 년 동안의 데이터에 대한 회귀 분석으로 예측 모델을 추정 한 경우에도 전체 관심 인구가 포함 된 것은 아닙니다.

관심있는 전체 모집단에 대한 완전한 데이터 세트에서 실제로 시작하는 경우 요약 통계를 계산하면됩니다. 여기에는 표준 편차가 포함될 수 있지만 이러한 표준 오류를 호출하는 것은 부적절합니다.이 용어는 샘플링 분포와 관련이 있지만이 경우 유일한 "샘플"은 전체 모집단입니다.

— 아담 베일리
소스

대단히 감사합니다. 더 명확하게하기 위해 나는이 질문에 '모든 국가'가 전체 인구로 간주됩니까? 그렇지 않은 경우, 일부 '슈퍼 인구'의 '샘플'을 의미합니다. '병렬 세계'에는 수백만 개의 국가가 있으며 지구상의 195 개 국가가 서로 독립적으로 동일하게 분포되어 있다고 가정합니다. 무작위로 샘플링됩니다. 너무 멀리 가져온 가정이 아닌가?

— 오사와 아키라