요약
세부 사항 섹션 에서 생각을 공유 합니다. 우리가 실제로 달성하고자하는 것을 식별하는 데 유용하다고 생각합니다.
여기서 중요한 문제는 순위 유사성이 무엇을 의미하는지 정의하지 않았다는 것입니다. 따라서 순위 간의 차이를 측정하는 방법이 더 나은 방법을 모릅니다.
실제로 이것은 추측에 근거한 방법을 모호하게 선택하게합니다.
내가 실제로 제안하는 것은 먼저 수학적 최적화 목표를 정의하는 것입니다. 그래야만 우리가 원하는 것을 진정으로 알 수있을 것입니다.
우리가 그렇게하지 않는 한, 우리가 원하는 것을 정말로 모른다. 우리는 수도 거의 우리가 원하는 것을 알고 있지만 거의 알고 알고 .≠
나의 텍스트 정보는 본질적으로의 수학적 정의에 도달 향해 단계 순위 유사성을 . 우리가 이것을 잡으면, 우리는 그런 유사성을 측정하는 가장 좋은 방법을 선택하기 위해 자신있게 나아갈 수 있습니다.
세부
유어 의견 중 하나를 기반으로 :
- " 목적은 두 그룹의 순위가 다른지 확인하는 것 "(Peter Flom)입니다.
목표 를 엄격하게 해석 하면서 이에 대답하려면 다음을 수행하십시오 .
- 순위는 어느 아이템 경우 다른 존재, 되도록 여기서 항목의 순위 인 그룹으로 및 은 IS 같은 항목이지만 그룹 순위입니다 .i a i ≠ b i a i i a b i b나는 ∈ { 1 , 2 , … , 25 }나는ㅏ나는≠ b나는aiiabib
- 그렇지 않으면 순위가 다르지 않습니다.
그러나 나는 당신이 정말로 그 엄격한 해석을 원한다고 생각하지 않습니다 . 따라서 나는 당신이 정말로 말하려는 의미는 다음과 같습니다.
- 그룹 와 의 순위는 어떻게 다릅니 까?bab
여기서 한 가지 해결책은 단순히 최소 편집 거리 를 측정하는 것 입니다. 즉, 그룹 의 순위가 매겨진 그룹 와 그룹 의 목록과 동일 해 지도록 수행해야하는 최소 편집 횟수는 무엇입니까 ?bab
편집은 두 항목을 교환하는 것으로 정의 될 수 있으며 필요한 홉 수에 따라 비용이 포인트입니다. 따라서 항목 을 항목 과 교체해야하는 경우 (그룹 와 의 순위를 동일하게하기 위해 )이 편집 비용은 입니다.1 3 a b 3n13ab3
그러나이 방법이 적합합니까? 이에 답하기 위해 조금 더 깊이 살펴 보겠습니다.
정규화되지 않았습니다. 우리 그룹 순위 간의 거리라고하면 인 그룹의 순위 사이의 간격 동안, 인 , 반드시 의미하지는 않으며 보다 서로 더 유사 이다 서로 (또한 가능한 것을 의미 할 수 아이템의 더 큰 세트의 순위를했다).3 c , d 123 a , b c , d c , da,b3c,d123a,bc,dc,d
각 편집 비용 은 홉 수와 관련하여 선형 이라고 가정합니다 . 애플리케이션 도메인에 해당 되는가? 그것은 일 수 있었다 물류 관계가 더 적합? 아니면 기하 급수적 인 것입니까?
모든 항목이 똑같이 중요하다고 가정합니다. 예를 들어 순위 항목 (예 : ) 의 불일치가 순위 항목 (예 : )의 불일치와 동일하게 처리 됩니다. 도메인에서 이것이 사실입니까? 예를 들어, 책 순위를 매기는 경우 TAOCP 책과 같은 유명한 책의 순위에 동의하지 않으며 TAOUP ?515
위의 요점을 해결하고 두 등급 사이의 적절한 유사성 척도에 도달하면 다음과 같은 더 흥미로운 질문을해야합니다.
- 그룹 와 의 차이 가 무작위 확률에 의한 것일 경우 그러한 차이를 관찰 할 확률은 얼마나 됩니까?bab
the best ways to compare these rankings
- 무엇을 2 개 그룹 BW 차이의 유형 당신이 알고 싶습니다?