지리적 가중 회귀 분석의 널값


12

설명 변수 중 일부에는 특정 다각형에 대해 몇 개의 null 값이 있습니다.

지리적 가중 회귀 분석이이를 처리 할 수 ​​있습니까? 아니면 전체 다각형과 모든 데이터를 제거해야합니까 (특정 다각형에 대한 독립적이고 독립적 인 변수)?


이 널은 무엇을 나타 냅니까? 해당 값이 적용되지 않거나 존재하지만 알 수 없습니까? 후자 인 경우 알 수 없습니까? (주요 관심사는 값을 알 수없는 이유가 값 자체와 관련이 있는지 여부입니다. 예를 들어 수 문학을 연구하고 지표를 설명 변수로 사용하는 경우 홍수로 인해 토지 덮개를 알 수없는 경우, 이는 중요한 정보이며 단순한 결측 가치 이상의 의미를 갖습니다.)
whuber

1
고맙습니다. 일부 null은 소규모 집계 단위로 인해 기밀 유지를 위해 생략 된 데이터를 나타내며, 다른 일부는 단순히 사용할 수 없지만 다른 변수에 영향을 미치는 설명 변수의 결과가 아닙니다. 나는 0 값을 가지므로 0은 특정 다각형에 대한 이벤트 / 속도를 나타내지 않으며 데이터가 누락 된 일부 null 값도 있습니다. 시작하는 데 약 29 개의 설명 변수가 있기 때문에 null이 포함 된 행의 다각형을 꺼내면 279에서 8 개의 다각형이 손실되고 필요하지 않기를 바랐습니다. 감사합니다!
나는 심장이

실종에 대한 정보와 이론을 가지고있어 기쁩니다. 변수의 값이 변수의 크기와 관련이있을 수 있으므로 누락 된 패턴에 잠재적 인 편향이 생길 수 있기 때문에 작은 단위에 대해서는 약간 신중해야합니다.
whuber

2
변수의 존재를 나타 내기 위해 변수를 도입하고 모든 원래 null 결과를 공통 값 (선택한 값은 중요하지 않음)으로 인코딩하여 null을 통합 할 수 있습니다. 널을 포함하는 각 변수마다 하나의 개별 표시기가 필요합니다. 무엇을 하든지 null을 0으로 바꾸지 마십시오 (또는 다른 상수). null은 0과 완전히 다른 것을 의미합니다.
whuber

1
@ whuber 귀하의 의견에 이것에 대한 답변을 작성하기에 충분할 것 같습니다.
PolyGeo

답변:


1

주변 데이터에서 '널'값을 추측 할 수 있습니다. 그렇게하면 데이터를 잃지 않기 때문에 제외하는 것보다 낫습니다. 물론 값을 추측하는 방법에주의해야합니다. 추측이 편향되면 모델도 마찬가지입니다.

참조 : http://handbook.cochrane.org/chapter_16/16_1_2_general_principles_for_dealing_with_missing_data.htm

과:

주의:

shapefile을 사용할 때마다 null 값을 저장할 수 없다는 점에 유의하십시오. 비 모양 파일 입력에서 모양 파일을 작성하는 도구 또는 기타 프로시 저는 널값을 0 또는 매우 작은 음수 (-DBL_MAX = -1.7976931348623158e + 308)로 저장할 수 있습니다. 예기치 않은 결과가 발생할 수 있습니다. shapefile 출력에 대한 지오 프로세싱 고려 사항도 참조하십시오. ( http://desktop.arcgis.com/en/arcmap/10.3/tools/spatial-statistics-toolbox/geographically-weighted-regression.htm )

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.