다중 대치 후 성향 점수 일치


34

나는 논문을 참조한다 : Hayes JR, Groner JI. "다중 대치 및 성향 점수를 사용하여 외상 레지스트리 데이터로 인한 부상 심각도에 대한 카시트 및 시트 벨트 사용의 효과를 테스트합니다." J Pediatr Surg. 2008 년 5 월; 43 (5) : 924-7.

이 연구에서는 15 개의 완전한 데이터 세트를 얻기 위해 다중 대치가 수행되었습니다. 그런 다음 각 데이터 세트에 대한 성향 점수를 계산했습니다. 그런 다음 각 관측 단위에 대해 완료된 15 개 데이터 세트 중 하나 (관련 성향 점수 포함) 중 하나에서 레코드를 무작위로 선택하여 단일 최종 데이터 세트를 생성 한 다음 성향 점수 일치로 분석했습니다.

내 질문은 : 이것은 여러 대치 후 성향 점수 일치를 수행하는 유효한 방법입니까? 다른 방법이 있습니까?

맥락 : 새 프로젝트에서 성향 점수 일치를 사용하여 두 가지 치료 방법의 효과를 비교하려고합니다. 누락 된 데이터가 있으며 MICER 의 패키지 를 사용하여 누락 된 값을 대치 한 다음 twang성향 점수 일치를 수행 한 다음 lme4일치하는 데이터를 분석하려고합니다.

업데이트 1 :

I 발명자들은 이러한 다른 접근 얻어 용지 (2011) 성향 점수 매칭 반복 된 공변량 통해 누락 된 미트라 로빈 및 라이터 제롬 P.을 순차 복수 전가 [작업 용지]

이 논문에서 저자는 모든 대치 된 데이터 세트에 대한 성향 스코어를 계산 한 다음 평균을 계산하여 그것들을 풀링합니다. 이는 포인트 추정을 위해 Rubin의 규칙을 사용하여 다중 대치의 정신에 속하지만 성향 스코어에 실제로 적용 할 수 있습니까?

이력서에있는 사람이이 두 가지 접근 방식 및 / 또는 다른 방법에 대한 해설을 제공 할 수 있다면 정말 좋을 것입니다 ....

답변:


20

가장 먼저 말해야 할 것은 방법 1 (샘플링)에는 많은 장점이없는 것 같습니다.이 방법은 다중 대치의 이점을 버리고 Stas가 언급 한 것처럼 각 관측에 대한 단일 대치로 줄입니다. 그것을 사용할 때 어떤 이점도 볼 수 없습니다.

힐에서 누락 된 데이터와 성향 점수 분석을 둘러싼 문제의 훌륭한 토론 (2004)가있다 : 힐, J. "데이터 누락에서 관찰 연구의 고통에 치료 효과 평가에 바이어스를 감소" 그것은에서 다운로드 ISERP 연구 보고서, 2004 여기 .

이 논문은 다중 대치 (및 결측 데이터를 처리하는 다른 방법)와 성향 점수를 사용하는 두 가지 접근법을 고려합니다.

  • 다중 대치 후 성향 점수의 평균화, 인과 추론 (위의 게시물의 방법 2)

  • 다중 대치로부터의 각각의 성향 스코어 세트를 사용한 인과 추론 및 인과 추정의 평균화.

또한이 논문은 결과가 대치 모델에서 예측 자로 포함되어야하는지 여부를 고려합니다.

힐은 결측 데이터를 다루는 다른 방법보다 다중 대치가 선호되지만 일반적 으로 선험적 근거는 없다고 주장한다.이러한 기술 중 하나를 다른 기술보다 선호하는 이유. 그러나, 특히 특정 매칭 알고리즘을 사용할 때 성향 점수의 평균을 선호하는 이유가있을 수 있습니다. 힐은 같은 논문에서 시뮬레이션 연구를 수행했으며 인과 추론 전에 성향 점수를 평균하면 대치 모델에 결과를 포함 할 때 평균 제곱 오차 측면에서 최상의 결과를 산출하고 결과는 평균없이 점수를 평균화한다는 것을 알았습니다. 대치 모델에서 평균 바이어스 (추정 된 효과와 실제 처리 효과의 절대 차이) 측면에서 최상의 결과를 얻었습니다. 일반적으로 대치 모델에 결과를 포함시키는 것이 좋습니다 (예 : 여기 참조 ).

따라서 방법 2가 진행되는 것처럼 보입니다.


1
방법 2를 이해하지만 R에서 구현하는 방법에 대해 손실이 있습니다. 누구든지 나를 가리키는 참조가 있습니까?
sam

1
두 방법 모두에 대한 R 코드는 cobalt"복잡한 데이터에 코발트 사용"이라는 제목 의 패키지 비네팅에 제공됩니다 . 당신은 여기에 액세스 할 수 있습니다 CRAN.R-project.org/package=cobalt
노아에게

13

두 패러다임의 충돌이있을 수 있습니다. 다중 대치 (multiple imputation)는 모델 기반의 베이지안 솔루션입니다. 적절한 대치 개념은 본질적으로 데이터의 잘 정의 된 사후 분포로부터 샘플링해야한다는 것을 나타냅니다. 반면 성향 점수 일치는 반모 수적 절차입니다. 성향 점수를 계산 한 후에는 (어떻든 상관없이 반드시 로짓 모델이 아닌 커널 밀도 추정값을 사용할 수 있음) 나머지를 수행 할 수 있습니다. 다른 공변량을 제어하는 ​​모델이 남아 있지 않기 때문에 동일한 성향 점수를 가진 처리 된 관찰과 처리되지 않은 관찰 사이의 차이를 가져 가면됩니다. 나는Abadie and Imbens (2008) 는 일부 일치하는 상황에서 실제로 표준 오류를 얻는 것이 불가능하다고 설명했습니다. 나는 역 성향에 의한 가중치 부여와 같은 더 부드러운 접근법에 더 많은 신뢰를 줄 것입니다. 이것에 대한 내가 가장 좋아하는 참고 문헌은 "무자비한 계량 경제학" 이고 "자수주의 동반자"라는 자막이며 경제학자를 겨냥했지만이 책은 다른 사회 과학자, 대부분의 생물 통계 학자 및 비 생물 통계 학자에게도 꼭 읽어야 할 책이라고 생각합니다. 그들은 다른 분야가 데이터 분석에 어떻게 접근하는지 알고 있습니다.

여하튼, 관측 당 15 개의 시뮬레이션 된 완전한 데이터 라인 중 하나만 사용하는 것은 단일 대치에 해당합니다. 결과적으로 15 개의 완료된 데이터 세트와 비교하여 효율성이 떨어지고 표준 오류를 올바르게 추정 할 수 없습니다. 어느 각도에서든 나에게 불완전한 절차처럼 보입니다.

물론, 우리는 카펫 아래에서 다중 대치 모델과 성향 모델 모두가 모든 올바른 기능적 형태로 모든 올바른 변수를 가지고 있다는 의미에서 정확하다고 가정합니다. 그것을 확인하는 방법은 거의 없습니다 (이 두 가지 방법 모두에 대한 진단 조치에 대해 다른 의견을 듣고 기뻐하지만).


(+1) 특히 나는 문자 매칭의 구현에 의해 도입 된 불연속성에 대해 기분이 좋지 않습니다 (제어 성향 점수의 가장 가까운 값으로 제어를 찾고 나머지는 무시하십시오) . 어쨌든 성향 점수는 항상 꽤 거친 절차로 나를 때렸습니다.
추기경

@cardinal, 업데이트를 참조하십시오.
StasK

실제로 다른 방법으로 일치시키는 것보다 IPTW에 대한 더 많은 비판을 보았습니다 (읽어야합니다). 성향 점수 별 가중 회귀 분석 ( Freedman & Berk, 2008 )을 참조하고 적용된 예는 Bjerk, 2009 를 참조하십시오 . 왜 당신이 여기에 무해한 계량 경제학 을 추천하는지 잘 모르겠지만 , 관찰 연구에 관심이있는 사람이라면 누구에게나 좋은 추천입니다.
Andy W

@Andy, Freedman & Berk 작품은 모든 것을 로지스틱 회귀로 모델링 할 수있을 때 훨씬 간단한 상황을 다루는 것 같습니다. 내 이해는 PSM과 같은 방법이 더 많은 공변량이있을 때 더 지저분한 상황에서 적용되며 모델이 올바르게 지정되었다고 가정 할만 큼 충분히 신뢰할 수 없다는 것입니다. 그들은 상황이 가중치 부여에 유리하다는 것을 알았지 만 다른 가능한 방법과 비교할 때 모델에 유리한 것으로 생각합니다.
StasK

2
데이터가 iid가 아니고 역 Hessian의 평등과 그라디언트의 외부 곱에 대한 최대 최대 가능성 이론이 더 이상 유지되지 않으며, 이들 중 어느 것도 분산의 일관된 추정치가 아닙니다. 샌드위치 분산 추정기, 측량 통계에서는 선형화 추정기, 계량 경제학에서는 백색의 강력한 추정기 등을 사용해야합니다.
StasK

10

나는 질문의 이론적 측면에 대해 말할 수는 없지만 PS / IPTW 모델과 다중 대치에 대한 경험을 줄 것이다.

  1. 나는 단일 데이터 세트를 구축하기 위해 다중 대치 데이터 세트와 무작위 샘플링을 사용하는 사람에 대해 들어 본 적이 없습니다. 그것은 반드시 그것이 틀렸다는 것을 의미하지는 않지만 사용하기에 이상한 접근법입니다. 또한 데이터 세트는 시간과 계산을 절약하기 위해 단 하나가 아니라 3-5 개의 모델을 실행하기 위해 창의성을 발휘할만큼 충분히 크지 않습니다.
  2. Rubin의 규칙과 풀링 방법은 꽤 일반적인 도구입니다. 풀링되고 곱하기 대치 된 결과는 분산과 추정치 만 사용하여 계산할 수 있으므로, 프로젝트에 사용할 수없는 것으로 볼 수있는 이유는 없습니다. 대치 된 데이터 생성, 각 세트에 대한 분석 수행 및 풀링. 그것은 내가 한 일, 내가 본 것입니다. 그리고 당신이 그것을하지 말아야 할 특정한 정당성이 없다면, 나는 당신이 더 이국적인 일을 할 이유를 알 수 없습니다-특히 당신이 무엇을 이해하지 못하는 경우 방법으로 진행합니다.

+1 이것은 고도로 전문화 된 논문 인 것처럼 좋은 답변을 제공하기 어려운 질문입니다. 그러나 이전의 유사한 질문에 대한 현상금을 상실한다고 주장하는 것 외에도 OP는 메타로 마이그레이션 된 솔루션을 구걸하는 질문을 추가했습니다. 나는 거기에 내 대답에 당신과 비슷한 의견을했다. 다중 대치 된 데이터 세트의 샘플에 대해 특히 모호합니다.
Michael Chernick

감사 ! 방법 2가 사용 된 위치에 대한 참조가 있습니까?
Joe King

@JoeKing 슬프게도, 내 머리 꼭대기에서 떨어져 있지 않습니다.
Fomite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.