나는 단지 200 만 회귀에 달렸다

저는 현재 "I Just Ranning Million Regressions"라는 제목의 인기있는 논문에 사용 된 방법을 구현하려고 노력하고 있습니다. 기본 개념은 모델에 어떤 컨트롤을 포함해야하는지 확실하지 않은 경우가 있다는 것입니다. 이러한 경우에 할 수있는 한 가지 방법은 무작위로 컨트롤을 그리고 수백만 가지의 다른 회귀를 실행 한 다음 관심 변수가 어떻게 반응하는지 확인하는 것입니다. 모든 사양에서 일반적으로 동일한 부호를 갖는 경우 부호가 항상 변경되는 변수보다 더 강력한 것으로 간주 할 수 있습니다.

종이의 대부분은 매우 명확합니다. 그러나이 논문은 다음과 같은 방식으로 모든 다른 회귀에 가중치를 부여합니다. 주어진 사양의 적분 가능성을 모든 사양에 대한 모든 적분 가능성의 합으로 나눕니다.

내가 겪고있는 문제는 통합 가능성이 내가 Stata에서 실행하려는 OLS 회귀와 어떻게 관련되는지 확실하지 않다는 것입니다. "통합 통합 가능성"과 같은 인터넷 검색 주제는 혼합 효과 로지스틱 회귀와 같은 항목을 계속 사용함에 따라 막 다른 골목이었습니다. 나는이 모델들이 이해하기에 너무 복잡하다고 고백한다.

나의 현재 해결 방법은 내가 이해하고있는 문헌에 사용 된 다른 가중치 체계가 있다는 것입니다. 예를 들어, 우도 비 지수에 기초하여 각 회귀에 가중치를 부여 할 수 있습니다. lri를 가중치로 사용하는 R 패키지도 있습니다. 당연히, 나는 또한 원래의 것을 구현하고 싶습니다.

어떤 충고?

종이 링크 : http://down.cenet.org.cn/upfile/34/2009112141315178.pdf

likelihood-ratio

— 니콜라이
소스

이 글은 여러분의 관심사 중 일부를 해결할 수 있습니다 ... stats.stackexchange.com/questions/215154/…

— Mike Hunter

내가 한 번 (그런데, 정말 모델 선택의 예술의 상태가 아닌) 살라이 마틴의 결과를 복제 MATLAB에서 함수를 작성, 참조 dropbox.com/s/mqa7qvhn7w5pkag/... . 통합 가능성 (정확히 참조하는 내용이 확실하지 않음)은 아마도 지수화 된 로그 가능성 일 것입니다.

— Christoph Hanck

감사! 179 페이지의 방정식 4를 참조하고 있습니다. "무게가 (통합 된) 가능성에 비례하는 경우"

— NikolaiB

OLS의 경우에도 우도 함수 (Christoph Hanck가 주석에서 언급 한 것처럼 지수화 된 로그 우도)를 계산할 수 있습니다. 그냥 좋은 것입니다 $L_i = \prod_i (2\pi \sigma^2)^{-.5} \exp(-.5 (y_i - x_i\beta)^2)$ . Stata는 이것을 e(ll)사용하여 회귀를 실행 한 후 이것을 저장합니다.regress

그런 다음 가중치를 다음과 같이 구성합니다. $w_i = \frac{L_i}{\sum_j L_j}$ .

마지막으로 회귀 계수의 가중 평균을 사용하여 $w_i$ 무게로.

— 슈퍼 프론 커
소스

나는 단지 200 만 회귀에 달렸다 – 통합 된 가능성