당신은 결과가 어디 고전적인 데이터 분석 문제를 고려 그리고 그것은 예측의 수와 관련되는 방법 . 여기서 염두에 두어야 할 기본 응용 프로그램 유형은
는 도시 의 범죄율과 같은 그룹 수준의 결과 입니다.
예측 변수는 도시 인구 통계 학적 특징과 같은 그룹 레벨 특성 입니다.
기본 목표는 회귀 모델을 맞추는 것입니다 (아마 임의 효과가 있지만 지금은 잊어 버립니다).
예측기 중 하나 이상이 각 단위에 대해 서로 다른 표본 크기를 가진 측량의 결과 일 때 약간의 기술적 어려움이 발생합니까? 예를 들어, 가정 도시에 대한 요약 점수 인 도시에서 개인의 샘플에서 평균 응답입니다 하지만 샘플이 평균의 기반이되었다 크기는 격렬하게 다르다 :
예측 변수는 각 도시마다 같은 의미를 갖지 않기 때문에 회귀 모델에서 이러한 변수를 조건부로 조정하면 마치 "평등하게"만들어지는 것처럼 오해의 소지가있을 수 있습니다.
이 유형의 문제에 대한 이름이 있습니까? 그렇다면이를 처리하는 방법에 대한 연구가 있습니까?
내 생각은 그것을 오류로 측정 된 예측 변수로 취급 하고이 선을 따라 무언가를 수행하지만 측정 오류에는 이분산성이 있으므로 매우 복잡합니다. 나는 이것을 잘못된 방식으로 생각하거나 더 복잡하게 만들 수 있지만 여기서 논의하면 도움이 될 것입니다.