소개 및 표기법 :
다음은 (실험에 따라) 종료되는 것으로 보이는 새롭고 간단한 알고리즘 버전입니다. 이제이를 증명하고 싶습니다.
표기법 은 차원 데이터 포인트 (벡터)를 나타냅니다. 나는 A, B, C의 세 세트를 가지고있다. , , :
x i ∈ R p
감안할 ,하자 의 평균 유클리드 거리 나타낸다 그에게 에 가까운 점 ; 및 의 평균 유클리드 거리 나타낸다 그에게 에서 가까운 점 .k ∈ N ∗ d A x i x i k A d C x i x i k C
연산:
선택한 일부 요소를 A에서 B로 또는 그 반대로 이동하여 세트 A 및 B를 반복적으로 수정하는 다음 알고리즘이 있으며 C는 항상 동일하게 유지됩니다 (변경하지 마십시오). 간단하게하기 위해 : 알고리즘의 목적은 세트 와 를 더 잘 분리하여 " 의 점이 알려진 고정 세트 의 점과 더 유사 "하고 " 점이 최종적으로 자기 유사하고 와는 멀리 최종 세트 "A B B C A C B
- A ′ = { x i ∈ A ∣ d A x i > d C x i }
A′={xi∈A∣dAxi>dCxi} ... (1) - A = A ∖ A ′
A=A∖A′ ; ... (2)B = B ∪ A ′B=B∪A′ - B ′ = { x i ∈ B ∣ d A x i < d C x i
비'= { x나는∈ B ∣ dㅏ엑스나는< d씨엑스나는 } ... (3) - B = B ∖ B ′ A = A ∪ B ′
B = B ∖ B' ; ... (4)A = A ∪ B' - 반복 (1), (2), (3), 그리고까지 (4) : (아무런 요소 이동 에 또는에서 로 , A는 '와 B'빈 될 수 없음) 또는 ( 또는 )A B B A | A | ≤ k | B | ≤ k
ㅏ 비 비 ㅏ | A | ≤k | B | ≤k
알고리즘은 두 가지 경우에 종료됩니다.
- 때또는 보다 작거나 같다| A | | B | 케이
| A | | B | 케이 - 또는 일 때 가장 일반적인 경우 는 더 이상 A와 B 사이에 요소가 이동하지 않음을 의미합니다.A ' = B ' = ∅
ㅏ'= B'= ∅
질문:
이 알고리즘이 결국 종료됨을 증명하는 방법은 무엇입니까? 알고리즘으로 엄격하게 최소화하거나 최대화 할 수있는 편리한 잠재적 기능을 찾지 못했습니다. 함수 같은 일부 함수를 성공적으로 시도하지 않았지만 반복 할 때마다 증가하지 않습니다. 함수 하지만 각 반복에서 감소되지 않는다. 함수 각 반복에서 감소 될 수없는 것으로 보인다. 함수∑ x ∈ A d C x + ∑ x ∈ B d A x ∑ x ∈ A d A x + ∑ x ∈ B d C x ∑ x ∈ A d A x + ∑ x ∈ B d B x ∑ x ∈ A d B x + ∑ x ∈ B d A x
노트:
- 포인트 가까운 세트의 수단 다음 포인트 (다른 것보다 )에서 , 가장 작은 유클리드 거리를 갖는
. 을 취 하면 분석이 간단 해집니다.k x S k x S x k = 1
케이 엑스 에스 케이 엑스 에스 엑스 k = 1 - 이것이 도움이되는지 아닌지는 모르겠지만 초기 세트 대해 다음 속성 이 있습니다 가 가장 가까운 지점 인 경우 처음에 에 및 할 수있는 가장 가까운 지점입니다 항상 다음 . 이것은 직관적으로 점이 점보다 더 가깝다는 것을 의미합니다 ., B , C ∀ X I ∈ B , X J ∈ X B ∈ C X 나 X ∈ C X J D 나 이야 t에게 N C E ( X I , X B ) < D 나 이야 t에게 N의 C e ( x j , x a ) B C A
A , B , C ∀ x나는∈ B , x제이∈ A 엑스비∈C xi xa∈C xj distance(xi,xb)<distance(xj,xa) B C A - 즉 쉽게 분석한다 경우 그것으로부터 점 자마자 알고리즘의 약간 다른 버전 고려 완전히 가능 이동해야 , 그것으로부터 이동 에 (지나가는없이 ) 및 경우도 마찬가지입니다 .A B A B A ' B
A B A B A′ B