여러 순위 목록의 전체 순위


13

나는 운이없이이 포럼을 포함하여 온라인으로 볼 수있는 많은 문헌들을 살펴 보았고 누군가 내가 현재 직면하고있는 통계적 문제를 도울 수 있기를 바랐다.

5 순위의 데이터 목록이 있으며 각 항목은 위치 1 (최고)에서 위치 10 (최악)까지 10 개의 항목을 포함합니다. 문맥 상, 각 목록의 10 개 항목은 동일하지만 순위를 결정하는 데 사용되는 기술이 다르기 때문에 순위가 다릅니다.

데이터 예 :

            List 1      List 2      List 3     ... etc
Item 1     Ranked 1    Ranked 2    Ranked 1     
Item 2     Ranked 3    Ranked 1    Ranked 2
Item 3     Ranked 2    Ranked 3    Ranked 3
... etc

위의 데이터를 해석하고 분석하여 각 테스트 및 위치에 따라 각 항목의 전체 순위를 보여주는 최종 결과를 얻을 수있는 방법을 찾고 있습니다.

Result
Rank 1 = Item 1
Rank 2 = Item 3
Rank 3 = Item 4
... etc

지금까지 나는 Pearson 's Correlation, Spearman 's Correlation, Kendall Tau 's B 및 Friedman 테스트를 수행하여이 정보를 해석하려고 시도했습니다. 그러나이 결과는 일반적으로 내 목록과 쌍을 이루거나 (예 : 목록 1과 목록 2를 비교 한 다음 목록 1 ~ 목록 3 등), 전체에 대해 Chi-Square, P-Values ​​등의 결과를 생성했습니다. 데이터.

누구나이 데이터를 통계적으로 건전한 방법으로 (후 대학원 / 박사 학위 적용 수준에서) 어떻게 해석 할 수 있는지 알고 있으므로 5 가지 테스트에서 목록의 각 항목의 중요성을 나타내는 전체 순위를 이해할 수 있습니까? 또는 다른 유형의 기술이나 통계 테스트가있는 경우 힌트 나 지침을 주시면 감사하겠습니다.

(또한 주목할 가치가 있으며, 합계, 평균화, 최소-최대 테스트 등과 같은 간단한 수학적 기술을 수행했지만이 수준에서 통계적으로 충분히 중요하다고 생각하지는 않습니다).

도움이나 조언이 있으면 대단히 감사하겠습니다. 시간 내 주셔서 감사합니다.


1
stats.stackexchange.com/search?q=valuation+rank 두 가지 질문이 적절하게 해석되어 중복 된 것으로 보이므로 이미 답변을 제공하고 있습니다 . 이것으로 충분합니까? 그렇지 않은 경우 상황에 대한 특별한 점을 이해하도록 도와주십시오.
whuber

답변 주셔서 감사합니다. 나는이 기사들을 살펴 보았고, 그들이 내가 찾고있는 것이 아닌지, 그것이 내 잘못에 대한 이해인지 확실하지 않습니다. 이 기사에서는 각 데이터 세트마다 다른 의미의 많은 변수가 있으며 순위가 다를 수 있거나 순위보다 정수 값이 더 상세 할 수 있다는 인상을 얻습니다. 나는 '가장 중요한 항목은 모두 항목 X, 그다음에 Y ... 그리고 마지막으로 (또는 가장 중요하지 않은) 항목 Z'라고 말할 수있는 통계적으로 입증 된 방법을 찾고 있습니다. 나는이 순위를 1-10의 평범한 숫자로 분석하는 것을 거의 고려하고 있습니다
Liam

1
이러한 스레드의 한 가지 중요한 점은 "통계적으로 입증 된 방법"이 존재하지 않는다는 것입니다. 그것은 평가 의 문제입니다 . 결과의 통계적 조합은 그 결과의 상충 관계를 반영합니다. 예를 들어 , "객체"는 자동차 일 수 있으며 "기술"은 다양한 속성 (비용, 연료 효율, 동력, 안락함 등)에 따라 순위를 매길 수 있습니다. "최고"에 대한 귀하의 개인적인 감각은 다른 사람의 감각과는 상당히 다를 수 있습니다. 둘 다 맞을 것입니다.
whuber

답을 얻었습니까? 여기에 의견을 남겨주세요 stats.stackexchange.com/questions/347336/…
Ray Coder

답변:


7

왜 당신이 상관 관계와 비슷한 측정법을보고 있는지 잘 모르겠습니다. 상관 관계가없는 것 같습니다.

대신 여러 옵션이 있지만 다른 옵션 보다 더 나은 것은 없지만 원하는 항목에 따라 다릅니다.

평균 순위를 취한 후 평균 순위를 매 깁니다 (그러나 이것은 데이터를 간격으로 취급합니다)

중앙값 순위를 취한 다음 중간 값 순위를 지정하십시오 (그러나 이로 인해 연결이 발생할 수 있음)

각 항목에서 얻은 1 위 투표 수를 가져와이를 기준으로 순위를 매기십시오.

마지막 장소 투표 수를 취하여 이를 바탕으로 (반대 적으로, 명백하게) 순위를 매 깁니다.

합리적이라고 생각하는 것에 따라 가중 가중치 조합을 만듭니다.


4
주석에서 언급 한 스레드에서 중요한 요점은 이것이 전체 문제의 핵심이라고 생각합니다 . 이러한 모든 방법은 임의적 입니다. 객관적인 방법이 있지만 데이터에 고유하지 않은 정보를 사용해야합니다. 이것이 통계보다는 평가 의 문제가되는 이유 입니다.
whuber

어떤 가중치 조합을 제안 하시겠습니까?
Archie

4

다른 사람들이 지적했듯이 추구 할 수있는 많은 옵션이 있습니다. 내가 권장하는 방법은 평균 순위, 즉 Peter의 첫 번째 제안을 기반으로합니다.

이 경우 최종 순위의 통계적 중요성은 2 단계 통계 테스트로 확인할 수 있습니다. 이는 프리드만 테스트 와 해당 사후 테스트, Nemenyi 테스트 로 구성된 비모수 적 절차 입니다. 둘 다 평균 순위를 기반으로합니다. 프리드먼 테스트의 목적은 귀무 가설을 거부하고이 결론입니다 있는 항목 사이에 약간의 차이가. 그렇다면 Nemenyi 테스트를 진행하여 실제로 다른 항목을 찾습니다. 우연히 발견되는 중요성을 피하기 위해 사후 테스트로 직접 시작하지는 않습니다.

이 두 테스트의 임계 값과 같은 자세한 내용 은 Demsar의 논문을 참조하십시오 .


2

Tau-x를 사용하십시오 (여기서 "x"는 "eXtended"Tau-b를 나타냄)). Tau-x는 Kemeny-Snell 거리 측정법과 동등한 상관 관계로, 거리 측정법의 모든 요구 사항을 충족하는 순위가 매겨진 항목 목록 간의 고유 한 거리 측정법으로 입증되었습니다. Kemeny와 Snell의 "사회 과학의 수학 모델"의 2 장을 참조하십시오. 또한 "합의 순위 문제에 적용 할 수있는 새로운 순위 상관 계수", Edward Emond, David Mason, 다중 기준 결정 분석 저널, 11 : 17- 28 (2002).

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.