패널 데이터 연구에서 누락 된 데이터의 전가를 다루는 문제를 해결하려고합니다 (오늘 내가 배운 것처럼 '패널 데이터 연구'를 올바르게 사용하고 있는지 확실하지 않습니다.) 2003 년 총 사망 횟수 데이터가 있습니다. 2009 년까지 모든 8 개월의 지구와 4 개의 연령 그룹에서 남성과 여성.
데이터 프레임은 다음과 같습니다.
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2006 11 01-4 0
Northern Male 2006 11 05-14 1
Northern Male 2006 11 15+ 83
Northern Male 2006 12 0 3
Northern Male 2006 12 01-4 0
Northern Male 2006 12 05-14 0
Northern Male 2006 12 15+ 106
Southern Female 2003 1 0 6
Southern Female 2003 1 01-4 0
Southern Female 2003 1 05-14 3
Southern Female 2003 1 15+ 136
Southern Female 2003 2 0 6
Southern Female 2003 2 01-4 0
Southern Female 2003 2 05-14 1
Southern Female 2003 2 15+ 111
Southern Female 2003 3 0 2
Southern Female 2003 3 01-4 0
Southern Female 2003 3 05-14 1
Southern Female 2003 3 15+ 141
Southern Female 2003 4 0 4
2007 년과 2008 년에 걸쳐 10 개월 동안 전 지구의 총 사망자 중 일부는 기록되지 않았습니다. 다중 대치 방법을 통해 이러한 결 측값을 추정하려고합니다. 일반 선형 모델 또는 SARIMA 모델을 사용하십시오.
가장 큰 문제는 소프트웨어와 코딩 사용입니다. Stackoverflow에 대한 질문을했는데 다음과 같은 작은 그룹으로 데이터를 추출하려고합니다.
District Gender Year Month AgeGroup TotalDeaths
Northern Male 2003 1 01-4 0
Northern Male 2003 2 01-4 1
Northern Male 2003 3 01-4 0
Northern Male 2003 4 01-4 3
Northern Male 2003 5 01-4 4
Northern Male 2003 6 01-4 6
Northern Male 2003 7 01-4 5
Northern Male 2003 8 01-4 0
Northern Male 2003 9 01-4 1
Northern Male 2003 10 01-4 2
Northern Male 2003 11 01-4 0
Northern Male 2003 12 01-4 1
Northern Male 2004 1 01-4 1
Northern Male 2004 2 01-4 0
가는 중
Northern Male 2006 11 01-4 0
Northern Male 2006 12 01-4 0
그러나 누군가 내가 오히려 내 질문을 여기에 가져와야한다고 제안했습니다. 아마도 방향을 물어보십시오. 현재이 데이터를 R에 대한 적절한 시계열 / 패널 연구로 입력 할 수 없습니다. 최종 목표는이 데이터 amelia2
와 해당 기능 이 포함 된 패키지를 사용하여 TotalDeaths
2007 년과 2008 년에 특정 월 동안 누락 된 것으로 대치 하는 데 있습니다. 잃어버린.
도움, 방법 및이 문제를 해결하는 방법에 대한 제안이 있으면 감사하겠습니다.
이것이 도움이된다면 Clint Roberts가 박사 학위 논문 에서 한 것과 비슷한 접근법을 따르려고합니다 .
편집하다:
@Matt가 제안한 'time'및 'group'변수를 만든 후 :
> head(dat)
District Gender Year Month AgeGroup Unnatural Natural Total time group
1 Khayelitsha Female 2001 1 0 0 6 6 1 Khayelitsha.Female.0
2 Khayelitsha Female 2001 1 01-4 1 3 4 1 Khayelitsha.Female.01-4
3 Khayelitsha Female 2001 1 05-14 0 0 0 1 Khayelitsha.Female.05-14
4 Khayelitsha Female 2001 1 15up 8 73 81 1 Khayelitsha.Female.15up
5 Khayelitsha Female 2001 2 0 2 9 11 2 Khayelitsha.Female.0
6 Khayelitsha Female 2001 2 01-4 0 2 2 2 Khayelitsha.Female.01-4
아시다시피 실제로 '자연'과 '자연스럽지 않음'에 대한 자세한 내용이 있습니다.
Amelia
조금 놀았 지만 포기했다 (이전에). 나는 이전에 비네팅을 보았지만 (어쨌든 그것을 잃어 버렸습니다!) 그냥 빨리 보았고 그것을 통해 갈 것입니다. 내가 지금 가지고있는 한 가지 문제는group
및time
변수 를 만드는 방법에 대해 확실하지 않다는 것 입니다. (나는 시계열 분석 / 예측을 위해 그것들을 만들려고 시도했지만 그 주위에 고리가 생겼다.) 그것이 비켓에 있다고 확신합니다. 그래서 고투하고 있다면 다시 연락 드리겠습니다. 다시 한번 감사드립니다 :)