나와 관련해 주셔서 감사합니다. 나는 어떤 종류의 통계학 자도 아니며 내가 상상하고있는 것을 설명하는 방법을 모릅니다. 따라서 Google은 나를 도와주지 않습니다 ...
작업중인 웹 응용 프로그램에 평가 시스템을 포함시키고 있습니다. 각 사용자는 각 항목을 정확히 한 번만 평가할 수 있습니다.
"강하게 싫어함", "싫어요", "좋아요"및 "강하게 좋아요"의 4 가지 값으로 스케일을 상상하고 각각 -5, -2, +2 및 +5의 값을 할당 할 계획이었습니다. .
이제 모든 항목의 평점 수가 동일하다면 가장 선호하는 항목과 가장 적은 항목을 명확하게 구분하여이 점수 체계에 상당히 익숙 할 것입니다. 그러나 항목의 평점 수가 동일하지 않으며 다른 사진에 대한 투표 수의 차이가 상당히 클 수 있습니다.
이 경우 두 항목의 누적 점수를 비교하면 평범한 등급이 많은 오래된 항목이 투표 수가 적은 예외적 인 새 항목보다 훨씬 높은 점수를 얻게됩니다.
따라서 내가 생각한 첫 번째 명백한 것은 평균을 취하는 것입니다. 그러나 이제 항목에 "+5"등급이 하나만있는 경우 99 "+5"등급을받은 항목보다 평균이 더 좋습니다. 그리고 1 "+2"등급. 직관적으로 이는 항목의 인기도를 정확하게 나타내지는 않습니다.
나는이 문제가 일반적이라고 생각하며 더 많은 예제를 사용 하여이 작업을 수행 할 필요가 없으므로이 시점에서 멈추고 필요한 경우 주석을 작성합니다.
내 질문은 :
- 이런 종류의 문제는 무엇이며이를 해결하는 데 사용되는 기술에 대한 용어가 있습니까? 나는 이것을 읽을 수 있도록 이것을 알고 싶습니다.
- 당신이 주제에 대한 평온한 자원을 알고 있다면, 나는 많은 링크를 부탁드립니다.
- 마지막으로, 이런 종류의 데이터를 효과적으로 수집하고 분석하는 방법에 대한 다른 제안에 감사드립니다.