수천 점의 데이터 세트가 여러 개 있습니다. 각 데이터 세트의 값은 공간의 좌표를 나타내는 X, Y, Z입니다. Z- 값은 좌표 쌍 (x, y)에서의 고도 차이를 나타냅니다.
일반적으로 GIS 분야에서 고도 오차는지면 진리 점을 측정점 (LiDAR 데이터 점)으로 빼서 RMSE에서 참조됩니다. 일반적으로 최소 20 개의 지상 점검 포인트가 사용됩니다. NDEP (National Digital Elevation Guidelines) 및 FEMA 지침에 따라이 RMSE 값을 사용하여 정확도 측정 값을 계산할 수 있습니다. 정확도 = 1.96 * RMSE.
"정확한 수직 정확도는 수직 정확도를 데이터 집합간에 동등하게 평가하고 비교할 수있는 값입니다. 기본 정확도는 수직 RMSE의 함수로 95 % 신뢰 수준에서 계산됩니다."
정규 분포 곡선 아래 면적의 95 %가 1.96 * std. 편차 내에 있지만 RMSE와 관련이 없음을 이해합니다.
일반적으로 나는이 질문을하고있다 : 2 데이터 세트에서 계산 된 RMSE를 사용하여 RMSE를 어떤 종류의 정확도와 어떻게 연관시킬 수 있습니까 (즉, 내 데이터 포인트의 95 %가 +/- X cm 내에 있음)? 또한 이러한 대규모 데이터 세트에 적합한 테스트를 사용하여 데이터 세트가 정상적으로 배포되는지 여부를 어떻게 확인할 수 있습니까? 정규 분포에 대해 "충분히 좋은"것은 무엇입니까? 모든 검정에 대해 p <0.05이어야합니까, 아니면 정규 분포 모양과 일치해야합니까?
다음 논문에서이 주제에 대한 아주 좋은 정보를 찾았습니다.
http://paulzandbergen.com/PUBLICATIONS_files/Zandbergen_TGIS_2008.pdf