인구 밀도 추정 모델


14

(인구, 면적, 모양) 데이터베이스는 인구 / 지역의 상수 값을 각 모양 (Census block, tract, county, state 등과 같은 다각형)에 할당하여 인구 밀도를 매핑하는 데 사용할 수 있습니다. 그러나 인구는 일반적으로 다각형 내에 균일하게 분포되지 않습니다. Dasymetric mapping 은 보조 데이터를 사용하여 이러한 밀도 추정값을 조정하는 프로세스입니다. 이 최근 검토에서 알 수 있듯이 사회 과학에서 중요한 문제입니다 .

그러므로 우리가 토지 표지 (또는 다른 이산 인자)의 보조지도를 이용할 수 있다고 가정하자. 가장 간단한 경우에, 우리는 수역과 같은 사람이 살 수없는 지역을 사용하여 인구가없는 곳을 설명하고 모든 인구를 나머지 지역에 할당 할 수 있습니다. 보다 일반적으로, 각각의 센서스 유닛 ( 은 표면적 , 갖는 부분 으로 조각된다 . 이에 따라 데이터 세트가 튜플 목록으로 확장됩니다.k x j i i = 1 , 2 , , kjkxjii=1,2,,k

(yj,xj1,xj2,,xjk)

여기서 는 단위 의 모집단 (오류없이 측정 된 것으로 가정) 이며, 반드시 그렇지는 않지만 모든 도 정확하게 측정 한다고 가정 할 수 있습니다 . 이 용어의 목표는 각 를 합계로 분할하는 것입니다. j x j iyjjxjiyj

yj=zj1+zj2++zjk

여기서 각각의 및 는 토지 표지 클래스 에 있는 단위 내의 모집단을 추정합니다 . 추정치는 편향되지 않아야합니다. 이 파티션은 밀도 를 인구 조사 다각형과 랜드 커버 클래스 의 교차점 에 할당하여 인구 밀도 맵을 개선합니다. . z j i j i z j i / x j i j th i thzji0zjijizji/xjijthith

이 문제는 현저한 방식으로 표준 회귀 설정과 다릅니다.

  1. 각 의 파티셔닝은 정확해야합니다. yj
  2. 모든 파티션의 구성 요소는 음이 아니어야합니다.
  3. 데이터에 오류가 없습니다. 모든 모집단 수 와 모든 영역 가 정확합니다. x j iyjxji

" 지능형 다 메트릭 매핑 "방법 과 같은 솔루션에 대한 많은 접근 방식이 있지만 필자가 읽은 모든 것에는 임시 요소가 있으며 편향 가능성이 분명합니다. 창의적이고 계산적으로 다루기 쉬운 통계 방법을 제안하는 답변을 찾고 있습니다. 즉시 적용은 c. - 씩 40 명 평균 센서스 유닛 (상당한 분획 0 명했지만)과 다스 지표면 클래스에 대한. 10 6105106


서식 문제가 해결되었습니다. 버그였습니다.
Rob Hyndman

@Rob 감사합니다.이 글을 읽어 주신 모든 분들께 감사드립니다 : 귀하의 의견이 삭제되기 전에보고 귀하의 노력에 감사드립니다.
whuber

1
P. A Zandbergen과 D. Ignizio,“소규모 인구 추정을위한 Dasymetric Mapping 기법 비교”,지도 제작 및 지리 정보 과학 37, no. 3 (2010) : 199–214. ingentaconnect.com/content/acsm/cagis/2010/00000037/00000003/… 블렌딩을 요구하는 것 같습니다.
fgregg

1
김화환과 Xiaobai Yao,“Pycnophylactic interpolation revisited : dasymetric-mapping method와의 통합,”International Journal of Remote Sensing 31, no. 21 (2010) : 5657. informaworld.com/10.1080/01431161.2010.496805
fgregg

1
아시다시피, 다 메트릭 매핑은 궁극적으로 생태 학적 추론 문제입니다. K. Imai의 최근 연구가 도움이 될 것입니다 : pan.oxfordjournals.org/content/16/1/41.abstract
fgregg

답변:


4

Dasymetric 맵핑에서 Mitchel Langford의 작업 을 점검 할 수 있습니다 .

그는 웨일즈의 인구 분포를 나타내는 래스터를 만들고 그의 방법 론적 접근 방식이 여기에 유용 할 수 있습니다.

업데이트 : 당신은 또한 작품을 살펴있을 수 있습니다 제레미 Mennis (특히 기사를).


2
감사합니다. 이 작업은 dasymetric mapping에 대한 최근 연구 웹에 대한 포인터를 제공합니다.
whuber

2

흥미로운 질문입니다. 다음은 통계 각도에서 이에 접근하는 임시 찌르기입니다. 각 영역 인구 수를 할당하는 방법을 생각해 봅시다 . 이 관계를 아래와 같이 나타냅니다.xji

zji=f(xji,β)

분명히, 우리가 에 부과하는 기능적 형태는 실제 관계와 근사치이므로 위의 방정식에 오류를 포함시킬 필요가 있습니다. 따라서 위의 내용은 다음과 같습니다.f(.)

zji=f(xji,β)+ϵji

어디,

ϵjiN(0,σ2)

오차항에 대한 분포 오차 가정은 설명을위한 것입니다. 필요한 경우 적절하게 변경할 수 있습니다.

그러나 의 정확한 분해가 필요합니다 . 따라서 아래와 같이 에러 항과 함수 에 제약을 가해 야 합니다.yjif(.)

iϵji=0

if(xji,β)=yj

적층형 벡터 나타낸다 의해 및 적층 결정 조건 에 의해 . 따라서, 우리는 :zjizjf(xji,β)fj

zjN(fj,σ2I)I(fje=yj)I((zjfj)e=0)

어디,

e 는 적절한 차원의 벡터입니다.

첫 번째 지표 제약 조건은 결정적 용어의 합이 합산되어야한다는 아이디어를 포착하고 두 번째 지표 는 오차 잔차가 0에 합산되어야한다는 아이디어를 포착합니다.yj

관측 된 정확하게 분해하기 때문에 모델 선택이 더 까다 롭습니다 . 모형 선택에 접근하는 방법은 오류 분산이 가장 낮은 모형, 즉 의 가장 낮은 추정치를 산출하는 모형을 선택하는 것입니다 .yjσ2

편집 1

위의 공식을 생각하면 필요한 것보다 많은 제약이 있으므로 단순화 할 수 있습니다.

zji=f(xji,β)+ϵji

어디,

ϵjiN(0,σ2)

적층형 벡터 나타낸다 의해 및 적층 결정 조건 에 의해 . 따라서, 우리는 : z j f ( x j i , β ) f jzjizjf(xji,β)fj

zjN(fj,σ2I)I(zje=yj)

어디,

e 는 적절한 차원의 벡터입니다.

의 제약 조건 은 정확한 분해를 보장합니다.zj


2
@Srikant 감사합니다. 나는 질문을 제기 할 때 비슷한 라인을 따라 생각하고 그 이후 로 다른 모델뿐만 아니라 GLM ( 선형 링크가있는 포아송 분포)을 테스트했습니다 . 불행히도, 이제는 토지 표지 유형만을 기반으로하는 모델처럼 보이며 비율이 제대로 작동하지 않습니다. 이러한 데이터의 샘플은 인구 패턴이 더 큰 공간적 상황에 의존한다는 것을 나타냅니다. 그런 다음 최소한 공간적으로 지연된 공변량을 선형 모형에 포함해야합니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.