설명하는 기술을 순차적 회귀에 의한 대치 또는 연쇄 방정식에 의한 다중 대치라고합니다. 이 기술은 Raghunathan (2001)에 의해 개척되어 잘 작동하는 R 패키지 mice
(van Buuren, 2012)로 구현되었습니다 .
Schafer and Graham (2002)의 논문은 왜 평균 대치 및 목록 삭제 (일반적으로 라인 제외라고 함)가 위에 언급 된 기술을 대체 할 수 없는지 잘 설명합니다. 주로 평균 대치가 조건부가 아니므로 대치 된 분포를 관측 된 평균쪽으로 편향시킬 수 있습니다. 또한 분산 분포에 대한 다른 바람직하지 않은 영향 중에서도 분산을 줄입니다. 또한, 목록 삭제는 실제로 동전 뒤집기와 같이 데이터가 무작위로 완전히 누락 된 경우에만 작동합니다. 또한 샘플 크기가 줄어들면 샘플링 오류가 증가합니다.
위에서 인용 한 저자는 일반적으로 최소 결 측값을 갖는 변수로 시작하는 것이 좋습니다. 또한이 기술은 일반적으로 베이지안 방식 (예 : 제안의 확장)으로 적용됩니다. 변수는 대치 절차에서 한 번만 아니라 자주 방문합니다. 특히, 각 변수는 최소 결 측값을 특징으로하는 변수부터 시작하여 조건부 후부 예측 분포를 통해 완성됩니다. 데이터 세트의 모든 변수가 완료되면 알고리즘은 첫 번째 변수에서 다시 시작한 다음 수렴 될 때까지 반복합니다. 저자들은이 알고리즘이 깁스 (Gibbs)라는 것을 보여 주었으며, 일반적으로 변수의 올바른 다변량 분포로 수렴합니다.
일반적으로, 임의의 데이터에서 누락 된 (예를 들어, 데이터가 관찰되는지의 여부는 관찰되지 않은 값이 아니라 관찰 된 데이터에만 의존하는) 일부 검증 불가능한 가정이 있기 때문에. 또한 절차가 부분적으로 호환되지 않을 수 있으므로 PIGS (부분적으로 호환되지 않는 Gibbs 샘플러)라고합니다.
실제로 베이지안 다중 대치는 여전히 다변량 비 모노톤 누락 데이터 문제를 처리하는 좋은 방법입니다. 또한 예측 평균 일치와 같은 비모수 확장은 회귀 모델링 가정을 완화하는 데 도움이됩니다.
Raghunathan, TE, Lepkowski, J., van Hoewyk, J. & Solenberger, P. (2001). 일련의 회귀 모델을 사용하여 결 측값을 곱하기위한 다변량 기법입니다. 측량 방법론, 27 (1), 85–95.
Schafer, JL, & Graham, JW (2002). 데이터 누락 : 최신 상태에 대한 우리의 견해. 심리학 적 방법, 7 (2), 147–177. https://doi.org/10.1037/1082-989X.7.2.147
van Buuren, S. (2012). 결측 데이터의 유연한 대치. 보카 레이 톤 : CRC Press.