정밀도 기반 (즉, 역 분산) ​​가중치가 메타 분석에 필수적인가?


10

정밀 분석 기반 가중치가 메타 분석의 중심입니까? Borenstein et al. (2009)는 메타 분석이 가능하기 위해서는 다음과 같은 것이 필요하다고 썼다.

  1. 연구에 따르면 단일 숫자로 표현할 수있는 포인트 추정치가보고됩니다.
  2. 해당 포인트 추정치에 대한 분산을 계산할 수 있습니다.

왜 (2)가 엄격하게 필요한지는 분명하지 않습니다. 그러나 실제로 널리 받아 들여진 메타 분석 방법은 모두 정밀 기반 (즉, 역 분산) ​​가중치 체계에 의존하며, 각 연구의 효과 크기에 대한 분산 추정이 필요합니다. Hedges 'Method (Hedges & Olkin, 1985; Hedges & Vevea, 1998)와 Hunter and Schmidt 's Method (Hunter & Schmidt, 2004)는 기본적으로 표본 크기 가중치를 사용하지만 이러한 방법은 정규화 된 평균 차이에만 적용되므로 요구됩니다. 다른 곳의 표준 편차. 각 연구에서 분산에 반비례하는 가중치가 전체 효과 크기 추정기의 편차를 최소화하므로이 가중치 체계가 모든 방법의 필수 기능입니까?

각 효과 크기에 대한 분산에 액세스하지 않고 체계적인 검토를 수행하고 결과를 여전히 메타 분석이라고 할 수 있습니까? 분산을 사용할 수없는 경우 표본 크기는 정밀도를 대리 할 가능성이있는 것 같습니다. 예를 들어, 효과 크기가 원시 평균 차이로 정의 된 연구에서 표본 크기 가중치를 사용할 수 있습니까? 이것이 결과 평균 효과 크기의 일관성과 효율성에 어떤 영향을 미칩니 까?


좋은 질문입니다. 명확한 특정 질문을 제기하면 독자를 도울 수 있습니다.
Subhash C. Davar

특히, 분산 데이터를 모든 연구에 사용할 수없는 경우 가중치 체계에 연구 간 이질성 (예 : 임의의 효과)을 측정하는 방법을 찾고 있습니다. 내 질문의 이전, 더 구체적인 버전은 여기에서 찾을 수 있습니다 : stats.stackexchange.com/questions/155063/…
Jennifer

답변:


11

이 질문은 대부분의 메타 분석 문헌에서 일반적인 혼란과 혼란 상태를 나타 내기 때문에 대답하기가 어렵습니다 (OP는 여기에서 비난받지 않습니다. , 종종 엉망인 가정, 모델 및 가정).

그러나 간단히 이야기하자면, 아닙니다. 아니요, 여러 가지 추정치 (일부 효과, 연관성 또는 관련성이 있다고 간주되는 다른 결과를 수량화)를 합치려면이 수를 합치면 합리적입니다. 그런 다음 (가중치 않은) 평균을 취하면 완벽하게 괜찮을 것입니다. 아무 문제가 없으며 메타 분석을 수행 할 때 일반적으로 가정하는 모델에서 이는 추정 자체가 편향되지 않은 것으로 가정하여 편견없는 추정치를 제공합니다. 따라서, 추정값을 결합하기 위해 샘플링 분산이 필요하지 않습니다.

그렇다면 왜 역 분산 가중이 실제로 메타 분석을하는 것과 거의 동의어일까요? 이것은 우리가 작은 연구 (샘플링 분산이 큰)보다 큰 연구 (샘플링 분산이 작은)에 더 많은 신뢰성을 부여한다는 일반적인 아이디어와 관련이 있습니다. 실제로, 일반적인 모델의 가정 하에서 역 분산 가중치를 사용하면 균일하게 최소 분산 편향 추정량을 얻을 수 있습니다.(UMVUE)-편견없는 추정을 가정하고 샘플링 분산이 실제로 정확히 알지 못한다는 사실을 무시하고, 스스로 추정되며 랜덤 효과 모델에서는 이질성에 대한 분산 성분을 추정해야합니다. 그러나 우리는 그것을 알려진 상수로 취급했습니다. 정확하지도 않습니다 ... 그러나 네, 우리가 눈을 아주 열심히 찌르고 일부를 무시하면 역 분산 가중치를 사용하면 UMVUE를 얻습니다. 문제.

따라서 편견 자체가 아니라 여기에 놓여있는 추정기의 효율성입니다. 그러나 비가 중 평균조차도 역 분산 가중 평균을 사용하는 것보다, 특히 임의 효과 모델에서 이질성이 큰 경우 (일반적인 가중 체계가 거의 균일 한 가중치를 유발하는 경우)보다 효율성이 떨어질 수 있습니다. 어쨌든!). 그러나 고정 효과 모델이나 이질성이 거의없는 경우에도 그 차이는 그리 크지 않습니다.

언급했듯이 표본 크기별 가중치 또는 일부 기능과 같은 다른 가중치 체계를 쉽게 고려할 수도 있지만, 이는 역 분산 가중치에 가까운 것을 얻으려는 시도 일뿐입니다 (샘플링 편차가 연구의 표본 크기에 의해 결정됨).

그러나 실제로 가중치와 분산 문제를 모두 '분리'할 수 있으며해야합니다. 그것들은 실제로 하나는 생각해야 할 두 개의 분리 된 조각입니다. 그러나 그것은 일반적으로 문헌에 물건이 제시되는 방식이 아닙니다.

그러나 여기서 중요한 점은 둘 다에 대해 정말로 생각해야한다는 것입니다. 예, 가중 평균을 합산 추정치로 계산할 수 있으며 이는 본질적으로 메타 분석 일 수 있지만 일단 합산 추정치에 따라 추론을 시작하려면 (예 : 가설 검정 수행, 신뢰 구간 구성) )의 경우 샘플링 분산 (및 이질성 양)을 알아야합니다. 이런 식으로 생각하십시오 : 작은 (그리고 매우 이질적인) 많은 연구를 결합하면, 동일한 수의 매우 큰 (및 / 또는 동종)을 결합하는 것보다 포인트 추정이 훨씬 덜 정확해질 것입니다. 스터디-결합 된 값을 계산할 때 추정값의 가중치에 관계없이.

실제로 추론 통계를 시작할 때 샘플링 분산 (및 이질성 양)을 알지 못하는 방법도 있습니다. 리샘플링 (예 : 부트 스트래핑, 순열 테스트)을 기반으로하는 방법 이나 모델의 일부를 잘못 지정하더라도 결합 된 추정치에 대해 일관된 표준 오류 를 생성하는 방법을 고려할 수 있습니다. 사례별로.


0

표준 오류 중 일부만 아는 경우 모두 해결 방법은 다음과 같습니다.

(1) 알려지지 않은 SE가 알려진 SE와 동일한 분포에서 무작위로 도출되거나, 알려지지 않은 SE를 가진 논문의 추정치에 대한 SE의 분포가 자유 변수라고 가정한다. 화려하고 싶다면 이러한 옵션보다 모델 평균을 사용할 수 있습니다.

(2) 최대 가능성을 통한 추정

SE가 알려지지 않은 연구가 '이상치'인 경우 모형은 다음과 같은 조합으로 이상을 설명합니다.

(a) 연구 결과 추정치에 대한 높은 SE를 보였을 가능성이 높다

(b) 연구에 무작위 효과가 큰 성분이있을 가능성이 높음 (연구자가 비정형 결과를 제공하는 데이터 세트 또는 방법 등을 선택 함)

실제로이 모형은 SE가 더 이상이 될수록 알려지지 않은 SE의 추정 정밀도를 떨어 뜨립니다. 이와 관련하여 '이상 값'을 포함시키는 것이 매우 강력합니다. 동시에, 분산이 알려지지 않았지만 일반적인 결과가있는 스터디를 많이 추가하면 SE 또는 최종 추정치가 떨어집니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.