설명 변수 중 일부에는 특정 다각형에 대해 몇 개의 null 값이 있습니다.
지리적 가중 회귀 분석이이를 처리 할 수 있습니까? 아니면 전체 다각형과 모든 데이터를 제거해야합니까 (특정 다각형에 대한 독립적이고 독립적 인 변수)?
이 널은 무엇을 나타 냅니까? 해당 값이 적용되지 않거나 존재하지만 알 수 없습니까? 후자 인 경우 왜 알 수 없습니까? (주요 관심사는 값을 알 수없는 이유가 값 자체와 관련이 있는지 여부입니다. 예를 들어 수 문학을 연구하고 지표를 설명 변수로 사용하는 경우 홍수로 인해 토지 덮개를 알 수없는 경우, 이는 중요한 정보이며 단순한 결측 가치 이상의 의미를 갖습니다.)
—
whuber
고맙습니다. 일부 null은 소규모 집계 단위로 인해 기밀 유지를 위해 생략 된 데이터를 나타내며, 다른 일부는 단순히 사용할 수 없지만 다른 변수에 영향을 미치는 설명 변수의 결과가 아닙니다. 나는 0 값을 가지므로 0은 특정 다각형에 대한 이벤트 / 속도를 나타내지 않으며 데이터가 누락 된 일부 null 값도 있습니다. 시작하는 데 약 29 개의 설명 변수가 있기 때문에 null이 포함 된 행의 다각형을 꺼내면 279에서 8 개의 다각형이 손실되고 필요하지 않기를 바랐습니다. 감사합니다!
—
나는 심장이
실종에 대한 정보와 이론을 가지고있어 기쁩니다. 변수의 값이 변수의 크기와 관련이있을 수 있으므로 누락 된 패턴에 잠재적 인 편향이 생길 수 있기 때문에 작은 단위에 대해서는 약간 신중해야합니다.
—
whuber
변수의 존재를 나타 내기 위해 변수를 도입하고 모든 원래 null 결과를 공통 값 (선택한 값은 중요하지 않음)으로 인코딩하여 null을 통합 할 수 있습니다. 널을 포함하는 각 변수마다 하나의 개별 표시기가 필요합니다. 무엇을 하든지 null을 0으로 바꾸지 마십시오 (또는 다른 상수). null은 0과 완전히 다른 것을 의미합니다.
—
whuber
@ whuber 귀하의 의견에 이것에 대한 답변을 작성하기에 충분할 것 같습니다.
—
PolyGeo