저는 현재 "I Just Ranning Million Regressions"라는 제목의 인기있는 논문에 사용 된 방법을 구현하려고 노력하고 있습니다. 기본 개념은 모델에 어떤 컨트롤을 포함해야하는지 확실하지 않은 경우가 있다는 것입니다. 이러한 경우에 할 수있는 한 가지 방법은 무작위로 컨트롤을 그리고 수백만 가지의 다른 회귀를 실행 한 다음 관심 변수가 어떻게 반응하는지 확인하는 것입니다. 모든 사양에서 일반적으로 동일한 부호를 갖는 경우 부호가 항상 변경되는 변수보다 더 강력한 것으로 간주 할 수 있습니다.
종이의 대부분은 매우 명확합니다. 그러나이 논문은 다음과 같은 방식으로 모든 다른 회귀에 가중치를 부여합니다. 주어진 사양의 적분 가능성을 모든 사양에 대한 모든 적분 가능성의 합으로 나눕니다.
내가 겪고있는 문제는 통합 가능성이 내가 Stata에서 실행하려는 OLS 회귀와 어떻게 관련되는지 확실하지 않다는 것입니다. "통합 통합 가능성"과 같은 인터넷 검색 주제는 혼합 효과 로지스틱 회귀와 같은 항목을 계속 사용함에 따라 막 다른 골목이었습니다. 나는이 모델들이 이해하기에 너무 복잡하다고 고백한다.
나의 현재 해결 방법은 내가 이해하고있는 문헌에 사용 된 다른 가중치 체계가 있다는 것입니다. 예를 들어, 우도 비 지수에 기초하여 각 회귀에 가중치를 부여 할 수 있습니다. lri를 가중치로 사용하는 R 패키지도 있습니다. 당연히, 나는 또한 원래의 것을 구현하고 싶습니다.
어떤 충고?
종이 링크 : http://down.cenet.org.cn/upfile/34/2009112141315178.pdf