고정 효과는 언제 실제로 고정됩니까?


12

다음 타입의 선형 관측 효과 모델을 생각해 여기서 관측되지 않은 그러나시 불변 특성이며, 에러이고, 및 개별 관측치 및 시간을 각각 색인화합니다. 고정 효과 (FE) 회귀 분석에서 일반적인 접근 방식은 개별 더미 (LSDV) / 탈 의미 또는 첫 번째 차이를 통해 를 제거하는 것 입니다.

yit=Xitβ+ci+eit
ceitci

내가 항상 궁금했던 점 : 는 언제 진정으로 "고정"됩니까?ci

이것은 사소한 질문으로 보일 수도 있지만 그 이유에 대한 두 가지 예를 들어 보겠습니다.

  1. 오늘 사람을 인터뷰하고 수입, 체중 등을 요청하여 얻도록하자 . 다음 10 일 동안 우리는 같은 사람에게 가서 매일 그녀를 다시 인터뷰하기 때문에 그녀에 대한 패널 데이터가 있습니다. 미래의 다른 시점에서 확실히 변할 때 10 일 동안이 관찰되지 않은 특성을 고정 된 것으로 취급해야합니까? 10 일 안에 그녀의 개인적인 능력은 변하지 않을 수 있지만 나이가 들면 변할 것입니다. 좀 더 극단적 인 방법으로 묻습니다. 하루에 10 시간 씩이 사람을 인터뷰하면 관찰되지 않은 특성이이 "표본"에 고정 될 가능성이 있지만 이것이 얼마나 유용합니까?X

  2. 이제 우리는 매월 85 년 정도 인생의 시작부터 끝까지 한 사람을 인터뷰한다고 가정 해 봅시다. 이번에는 무엇이 고정되어 있습니까? 출생지, 성별 및 눈 색깔은 가장 가능성이 높지만 그 외에는 다른 것을 생각할 수 없습니다. 그러나 더 중요한 것은 삶의 한 시점에서 변화하는 특성이 있지만 변화가 무한히 작은 경우 어떻게해야할까요? 그러면 실제로이 특성이 준 고정 될 때 바뀌었기 때문에 더 이상 고정 된 효과가 아닙니다.

통계적인 점에서 고정 효과가 무엇인지는 분명하지만 직관적 인 점에서는 이해하기 어려운 부분입니다. 어쩌면 다른 누군가가 이전에 이러한 생각을하고 고정 효과가 실제로 고정 효과인지에 대한 논쟁을 생각해 냈습니다. 나는이 주제에 대한 다른 생각들을 대단히 감사하겠습니다.


2
+1, 좋은 질문 및 좋은 답변. 아마도 그 기억 그것의 가치, "all models are wrong, but some are useful"- 조지 박스 .
gung-Monica Monica 복원

나는 이것에 대해 혼란 스러울 수 있지만 연속체는 아닙니다 : 1) 가 모든 대해 동일하게 취급 되면 풀링 된 모델이 있습니다 .2) 가 모든 대해 동일하게 취급되는 경우 ( "연도"또는 "일"을 포함 할 수있는 그룹의 더미 변수), FE 모델이 있고 3) 가 분포로 취급되는 경우 RE 모델이 있습니다. userwww.service.emory.edu/~tclark7/randomeffects.pdf를 참조하십시오 . ciicizj[i]cj[i]
Wayne

답변:


9

에 대한 인과 추론에 대한이 공식에 관심이 있다면 표시되는 알 수없는 양은 관련 인과 양을 식별하기위한 고정 효과에 대한 연구 / 데이터 기간 동안 만 안정적 합니다. βci

로 표시되는 수량 이이 기간 동안에도 안정적이지 우려되는 경우 고정 효과는 원하는 것을 수행하지 않습니다. 당신이 임의 사이의 상관 관계를 기대한다면 있지만 그럼 당신은 대신 임의 효과를 사용할 수 있습니다 및 당신이 조건에 싶어 에 멀티 레벨 설정에서. 이 상관 관계에 대한 우려는 종종 고정 효과 구성에 대한 동기 중 하나입니다. 많은 (전부는 아님) 상황에서 걱정할 필요가 없기 때문입니다.ciciXiciX¯i

간단히 말해, 로 표시되는 수량의 변동에 대한 우려 는 매우 합리적이지만 대부분 보유한 기간이나 보유하지 않은 기간이 아닌 보유한 기간의 데이터에 영향을 미치기 때문입니다.ci


+1이 답변이 마음에 듭니다. 그러나 샘플 기간 동안 고쳐질 것으로 예상되는 아주 작은 변화는 어떻습니까? 10 일 동안 샘플에있는 사람이 6 일째에 머리를 치고 그 후에 사망 한 뇌 세포에 의해 표현되는 무한한 소량으로 지능이 떨어질 경우 (사소한 예와 같이) 거의 고정되어 있습니까?
Andy

1
확실한. 어쩌면 다음과 같이 생각해보십시오. 고정 된 매개 변수 이며 세계에서 '정말'상수를 나타내는 것이거나 실제로 변하는 것의 평균을 나타내는 경우와 같이 그렇지 않을 수도 있습니다. 문제는 다른 어떤 것보다는 고정 된 효과를 내기 위해 어떤 추론 적 차이를 만드는가입니다. 인과 추론의 경우 문제는 다음과 같습니다. 고정 효과 가 매개 변수 증가 혼란에 의해 포착되지 않은 작은 변화보다 혼란이 감소 한다고 가정 합니다.
conjugateprior

@ 앤디 : 뇌의 일부 세포가 외상을 입었 기 때문에 누군가의 IQ를 바꾸는 머리에 대한 충격에 대해 이야기하기 시작하면 어디에서 멈추나요? 현실 세계에서 측정하는 것은 고정되어 있으므로 정확하게 측정 할 수있는 순간 순간적으로 (무한 적으로) 변하지 않습니다. 당신은 단순히 합리적인 판단을 사용하고 결과를 진술 할 때 그 판단에 대해 명시해야합니다. 공역 주의자가 말했듯이 고정 효과는 "변경 불가능"과는 다른 개념이며 특정 사물 (매개 변수)과 특정 목표 (인구, 그룹 등)를 모두 나타냅니다.
Wayne

당신은 뇌 세포를 가진 예가 어느 정도 멀다는 것을 맞습니다. 대부분의 교과서와 강의가이 직관적 인 측면에서 다소 침묵하기 때문에 고정 효과의 본질에 대해 더 많이 생각하고 싶었습니다. 물론 그들은 예를 제시하지만 그 중 어느 것도 내 질문에 대답하지 않을 것입니다. 이 목적을 위해 여기 에이 질문을 제기하는 것이 매우 유용했으며 지금까지 답변과 의견이 매우 유용했습니다.
Andy

2

고정 효과와 임의 효과의 구별은 일반적으로 효율성 문제 외에도 테스트에 대한 상당한 의미 외에 추정치에 영향을 미치지 않습니다 (편집 : 최소한 간단한 교과서에서는 상관되지 않은 경우).

테스트를 위해 신호를 넘어서는 잡음의 수준은 무엇입니까? 즉, 조사 결과를 일반화하려는 인구는? 예 (1) 사용 : 같은 날의 변동성, 더 긴 기간 또는 다른 개인의 변동성이어야합니까?

추론 할 수있는 분산 성분이 많을수록 과학적 발견이 더 강력 해지고 복제 가능성이 높아집니다. 잡음이 강해질뿐만 아니라 신호 ( ))가 약 따라 요청할 수있는 일반화의 양에는 제한이 있습니다 . 이것을보기 위해, 가 체중에 미치는 의 예상 효과 이지만 단일 대상의 일부 수명이 아니라 모든 포유류 에 미치는 영향을 상상해보십시오 .E(ciE(ci)Xi


나는 당신의 나머지 답변을 따를 수는 있지만 첫 부분에 대해서는 의문입니다. 고정 효과는 와 고정 효과 사이에 임의의 상관 관계를 허용하지만 임의 효과에서는 두 가지가 상관되지 않아야합니다. 이것이 사실이 아니면, RE가 일치하지 않습니다. 따라서 이것은 추정에 영향을 미칩니다. X
Andy

랜덤 가 와 상관 관계가 없어도 고정 추정치에 비해 여전히 서로를 향해 축소 됩니다. cXc
conjugateprior

@ conjugateprior : 는 실제로 축소되었지만 그룹 유추는 축소되지 않은 있습니다. ciE(ci)
JohnRos 2016 년

@Andy : RE에서 효과와 노이즈 사이의 상관 관계를 허용하지 않는 이유는 없지만 나머지 답변에 동의하면 내 답변을 편집하기 만합니다.
JohnRos 2016 년

2

나는 비슷한 질문으로 어려움을 겪었고 , 그의 역설과 Novick의 예측을 위해 Festschrift (블로그 게시물)를 참조하십시오 . 그리고 최선의 시도는 여기 있습니다 (내가 잘못하면 정정으로). 우리 가 방정식에서 비임의 충격 를 삭제하면 다음과 같이됩니다.Xitβ

yit=ci+eit

시간을 거슬러 올라가면 무작위 산책로로 볼 수 있습니다.

yit=ci+eityit1=ci+eit1yityit1=eiteit1

따라서 이것은 단지 연구의 지속 기간 동안 만 안정적 일 필요가있는 공액 사전 응답 의 재구성 일뿐입니다. 그러나 재구성이 유용하다고 생각합니다. 따라서 연구 기간 동안 관심있는 치료가 없다면 부분은 임의의 외생 적 충격에 의해서만 유도되는 결과가 임의의 보행이 될 것이라고 생각하는 것이 합리적입니다 . ' 에스? 물론 이것은 사소한 농부의 상황을 제외하고 는 사실이 아닙니다 .Xitβeit

그것은 나의 충고가 끝나는 곳이다. gung이 George Box 문구를 언급했듯이 "모든 모델이 잘못되었지만 일부는 유용합니다". 특정 연구 설계에서이 단순화가 정당화되는시기를 결정하는 방법보다 나보다 더 잘 알고있을 것입니다. 랜덤 워크는 현실의 정확한 표현이 아니라 작은 시간 동안이라도 관찰 할 수 없다고 가정 할 수 있습니다 .ci

특정 설문 조사의 예에서 흐름 유형 데이터 (예 : 소득, 무게)를 측정하는 질문은 특히 짧은 시간 동안 무작위로 걸 으면 합리적 일 수 있습니다. 그러나 주식 유형 데이터 ( 오늘 마시는 커피의 수 와 같은 )는 좀 더 잘못된 추정 일 것 같습니다.


+1 링크와 답변에 감사드립니다! 이 질문에 여전히 관심을 끌고 더 많은 질문을 추가 할 수있어서 기쁩니다. 통찰력이있었습니다.
Andy
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.