네 개의 숫자 변수가 있습니다. 그들 모두는 토양 품질의 척도입니다. 변수가 높을수록 품질이 높아집니다. 그들 모두의 범위는 다릅니다 :
1에서 10까지의 Var1
1000에서 2000 사이의 Var2
150에서 300 사이의 Var3
0에서 5까지의 Var4
4 가지 변수를 단일 토양 품질 점수로 결합하여 순서를 성공적으로 평가해야합니다.
내 생각은 매우 간단합니다. 네 가지 변수를 모두 표준화하고 합산하면 순위가 매겨지는 점수입니다. 이 방법을 적용하는 데 문제가 있습니까? 다른 추천 방법이 있습니까?
감사
편집하다:
고마워 많은 논의가 "도메인 전문 기술"... 농업 분야 ... 더 많은 통계 대화를 기대하는 반면. 내가 사용할 기술 측면에서 볼 때 ... 실험으로서 간단한 z- 점수 요약 + 로지스틱 회귀가 될 것입니다. 대다수의 샘플은 90 %의 품질이 좋지 않기 때문에 3 가지 품질 범주를 하나로 결합하고 기본적으로 이진 문제가 있습니다 (일부 대 비 품질). 하나의 돌로 두 마리의 새를 죽입니다. 이벤트 속도 측면에서 샘플을 늘리고 샘플을 분류하도록 전문가를 활용합니다. 그런 다음 전문가 분류 샘플을 사용하여 전문가와의 일치 / 불일치 수준을 최대화하기 위해 로그-레지 모델에 맞출 것입니다 .... 어떻게 들립니까?