Steepest Hill Climbing에서 Stochastic Hill Climbing을 언제 선택해야합니까?


답변:


3

가장 가파른 언덕 등반 알고리즘은 볼록 최적화에 효과적입니다. 그러나 실제 문제는 일반적으로 볼록하지 않은 최적화 유형입니다. 여러 개의 피크가 있습니다. 이 경우이 알고리즘이 임의의 솔루션에서 시작되면 전체 피크 대신 로컬 피크 중 하나에 도달 할 가능성이 높습니다. Simulated Annealing과 같은 개선 사항은 알고리즘이 로컬 피크에서 멀어 지도록하여이 문제를 개선하여 글로벌 피크를 찾을 가능성을 높입니다.

분명히, 하나의 봉우리 만있는 간단한 문제의 경우 가장 가파른 언덕 등반이 항상 좋습니다. 글로벌 피크가 발견되면 조기 중지를 사용할 수도 있습니다. 이에 비해 시뮬레이션 된 어닐링 알고리즘은 실제로 전체 피크에서 벗어나 다시 돌아와 다시 점프합니다. 이것은 충분히 냉각되거나 미리 설정된 특정 횟수의 반복이 완료 될 때까지 반복됩니다.

실제 문제는 시끄럽고 누락 된 데이터를 처리합니다. 확률 적 인 언덕 등반 접근법은 느리지 만 이러한 문제에 대해 더 강력하며 최적화 루틴은 가장 가파른 언덕 등반 알고리즘과 비교하여 전 세계 피크에 도달 할 가능성이 높습니다.

에필로그 : 솔루션을 설계하거나 다양한 알고리즘 중에서 성능 계산 비용 절충을 선택할 때 지속적인 의문을 제기하는 좋은 질문입니다. 의심 할 수 있듯이 답은 항상 : 알고리즘의 우선 순위에 따라 다릅니다. 데이터 배치에서 작동하는 일부 온라인 학습 시스템의 일부인 경우 시간 제약이 있지만 성능 제약이 약합니다 (다음 데이터 배치는 첫 번째 데이터 배치로 인한 잘못된 편향을 수정합니다). 반면, 사용 가능한 전체 데이터가있는 오프라인 학습 작업 인 경우 성능이 주요 제약 조건이며 확률 적 접근 방식이 권장됩니다.


2

먼저 몇 가지 정의부터 시작하겠습니다.
Hill-climbing 은 검색 알고리즘으로 단순히 루프를 실행하고 값이 증가하는 방향, 즉 오르막 방향으로 지속적으로 이동합니다. 루프 가 피크에 도달하고 더 높은 값을 가진 이웃이 없으면 루프가 종료 됩니다.

언덕 등반 의 변형 인 확률 적 언덕 등반 은 오르막길에서 무작위로 선택합니다. 선택의 가능성은 오르막길의 가파른 정도에 따라 달라질 수 있습니다. 잘 알려진 두 가지 방법은 다음과 같습니다.
첫 번째 선택 언덕 오르기 : 현재 상태보다 나은 후자 가 생성 될 때까지 후임자를 무작위로 생성합니다. * 주에 후임자가있는 경우 (예 : 수천 또는 수백만) 양호합니다.
랜덤 재시작 언덕 등반 :"성공하지 않으면 다시 시도하십시오"라는 철학에 따라 작동합니다.

이제 당신의 대답입니다. 확률론적인 언덕 오르기는 실제로 많은 경우에 더 잘 수행 할 수 있습니다 . 다음과 같은 경우를 고려하십시오. 이미지는 상태 공간 풍경을 보여줍니다. 이미지에 제시된 예는 인공 지능 : 현대적 접근 책에서 발췌 한 것입니다 .

여기에 이미지 설명을 입력하십시오

현재 상태로 표시된 지점에 있다고 가정하십시오. 간단한 언덕 오르기 알고리즘을 구현하면 로컬 최대 값에 도달하고 알고리즘이 종료됩니다. 보다 최적의 목적 함수 값을 갖는 상태가 있지만 알고리즘이 로컬 최대 값에 도달하면 도달하지 못합니다. 알고리즘은 평평한 로컬 최대 점에 멈출 수 있습니다.
랜덤 재시작 언덕 등반은 목표 상태가 발견 될 때까지 무작위로 생성 된 초기 상태에서 일련의 언덕 등반 검색을 수행합니다.

언덕 등반의 성공은 국가 공간 풍경의 모양에 달려 있습니다. 극소수의 평평한 고원이 거의없는 경우; 랜덤 재시작 언덕 오르기는 좋은 해결책을 매우 빨리 찾을 것입니다. 대부분의 실제 문제는 상태 공간이 매우 거칠기 때문에 언덕 오르기 알고리즘이나 그 변형에 적합하지 않습니다.

참고 : Hill Climb Algorithm 을 사용 하여 최대 값뿐만 아니라 최소값을 찾을 수도 있습니다 . 내 대답에 최대라는 용어를 사용했습니다. 최소값을 찾는 경우 그래프를 포함하여 모든 것이 반전됩니다.


확률 적 언덕 오르기 알고리즘이 실제로 어떻게 작동하는지에 대해 더 자세히 설명해 주시겠습니까?
Mostafa Ghadimi

1

나는이 개념들도 처음이지만, 내가 이해 한 방식으로, 계산 시간이 중요한 경우 (토론 적 기능 계산 포함) 스토캐스틱 힐 클라이밍이 더 잘 수행되지만 실제로 최고에 도달 할 필요는 없습니다. 가능한 해결책. 지역 최적 점에 도달해도 괜찮습니다. 떼에서 작동하는 로봇이 이것을 사용할 수있는 한 예입니다.

가장 가파른 언덕 등반에서 볼 수있는 유일한 차이점은 이웃 노드뿐만 아니라 이웃의 후속 작업도 검색한다는 것입니다.


0

TLDR : 세계 최적의 값을 찾으려고 시도하는 경우에스, 어디 에스 는 여러 개의 로컬 옵티마가 포함 된 점수 함수이므로 모든 로컬 옵티마가 동일한 값을 갖지는 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.