순위 지정을위한 기계 학습 알고리즘


10

나는 요소의 집합을 가지고 X 내가 설명 할 수있는 n형질. 그러므로:

xi:{ci1,ci2,,cin}xiX

어디 cij 요소에 대한 (숫자) 평가 i 특성에 따라 j. 내 요소는 점으로 볼 수 있습니다n 차원 공간.

내 독서에 따르면, "Bayes Classifier"와 같은 알고리즘이 있습니다.이 알고리즘은 일부 세트로 구성된 "훈련 세트"를 사용하는 경우 세트의 모든 요소에 대해 "예"또는 "아니오"유형의 답변을 제공 할 수 있습니다. 내 세트의 요소 및 알고리즘의 예상 결과. 이 데이터를 기반으로 알고리즘은 학습 세트의 일부가 아닌 다른 요소를 사용할 수 있어야하며 학습 세트 덕분에 학습 한 내용을 기반으로 "예"또는 "아니오"답변을 제공 할 수 있어야합니다. 이것은 당신이 기대하는 것 (훈련 세트)에 대해 어떤 종류의 아이디어가 있지만 그 결과를 산출하는 특정 규칙을 확신하지 못하는 경우에 좋습니다.

내 데이터로 수행하고 싶은 것은 "예"또는 "아니오"유형의 답변을 얻지 못하지만 요소 내에 순위를 소개하고 싶습니다. 그들 중 일부는 다른 것보다 "더 낫다". Bayes 필터와 마찬가지로, 내가 기대하는 것에 대한 일반적인 아이디어를 얻었습니다. 따라서 내 요소의 하위 집합에서 가져온 "훈련 순위"를 생성하여 MLA에 적용 할 수있었습니다. 그 훈련을 바탕으로 내 전체 세트의 순위를 매길 수있을 것입니다.

이를 위해 두 가지 접근 방식이 있습니다.

  1. 각 요소에는 MLA가 점수를 부여한 다음 점수에 따라 요소의 순위를 지정합니다.
  2. MLA는 두 가지 요소를 취할 수 있습니다 xixj어느 쪽이 더 좋은지 결정하십시오 (쌍별 비교). 해당 비교 연산을 사용하여 퀵 정렬을 사용하십시오.

참고 : pairwise 함수는 점수를 기반으로 구현하기가 쉽지 않으며 pairwise 함수를 기반으로 점수를 생성하는 것이 쉽지 않으므로 동일한 결과를 얻는 두 가지 접근 방식입니다.

점수 함수 또는 쌍별 비교 함수를 제공 할 수있는 MLA의 예가 있습니까?

편집 : 더 많은 컨텍스트를 추가하려면 : 현재 내 항목은 계산하여 각 항목에 대해 점수 (실수)를 생성하는 알고리즘에 따라 순위가 결정됩니다. cij. 생성 된 순위는 매우 정확하지만, 알고리즘을 수정하여 어떤 방식으로 알고리즘을 수정해야하는 경우가 있습니다. 예상했던대로 순위가 매겨지지 않은 일부 항목을 명확하게 볼 수 있기 때문입니다.

현재 내 디자인 프로세스는 다음과 같습니다.

  1. 완벽한 순위가 무엇인지에 대한 아이디어를 얻으십시오
  2. (수동으로) 그와 같은 항목의 순위를 매기는 알고리즘을 유도하십시오.
  3. 결과를 관찰하십시오
  4. 알고리즘을 적응

프로세스의 시작점이 교육 데이터로 사용될 수있는 것이기 때문에 MLA에 대해 생각했습니다. 아마도 현재 순위를 가져 와서 필요에 따라 항목을 교환하고 공급합니다.

답변:


3

많은 분류 알고리즘은 이미 원하는 것을 정확하게 수행하지만 종종 이진 (또는 n- 방향) 판단의 형태로 사용자에게 답변을 제시합니다. 예를 들어, SVMLight 는 지원 벡터 머신 분류 알고리즘의 구현입니다. 사람들은 일반적으로 이것을 사용하여 일부 데이터 세트에 대한 이진 판단을합니다. 그러나 후드에서 일어나는 일은 알고리즘이 서명 된 신뢰 판단을 데이터에 할당한다는 것입니다. 이들은 -1.0과 1.0 사이에 있으며 데이터 순위를 매기는데 사용해야합니다!


2

회귀 분석을 사용할 수있는 것 같습니다 . 또한 트레이닝 세트의 요소에 점수 (실수)를 지정하지 않은 경우 점수를 지정해야합니다. 순위를 목표 값으로 만 사용할 수 있지만 훈련 샘플이 적은 경우 모델이 나빠질 수 있습니다.


0

기계 학습 알고리즘에서 너무 많이 기대하고 있다고 생각합니다. 컴퓨터는 항목 1이 항목 2보다 나은지 여부를 결정할 수 없습니다. 머신 러닝 알고리즘이 할 수있는 것은 아이템 1을 아이템 2보다 우수하게 평가 한 몇 가지 예를 제시하면 아이템 순위를 정할 수 있다는 것입니다 [1]. 그러나 항목의 예를 제공하고 교육 데이터의 모든 항목에 대해 항목 1이 항목 2보다 큰지 여부에 대한 정보를 제공하는 교육 데이터가 여전히 필요합니다.

[1] http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html


링크 주셔서 대단히 감사합니다. 그리고 나는 후속 항목의 순위를 정할 수 있도록 알고리즘에 훈련 세트를 제공해야한다는 것을 완전히 이해합니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.