MCTS / UCT의 응용


10

MCTS / UCT 는 적기 알고리즘을 사용하여 탐색 할 유망한 노드를 선택하는 게임 트리 검색 방법입니다. 게임은 무작위로 완료되며 더 많은 승리로 이어지는 노드가 더 많이 탐색됩니다. 적기 알고리즘은 승률이 높은 노드 탐색과 알 수없는 노드 탐색 사이의 균형을 유지합니다 (순수한 형식에서는 반드시 휴리스틱 평가 기능을 사용하지는 않습니다). 이 일반적인 기술을 기반으로 한 프로그램은 컴퓨터 이동 에서 매우 놀라운 결과를 얻었습니다 .

도적 중심의 몬테카를로 검색이 다른 검색 문제에 적용 되었습니까? 예를 들어, MAX-SAT, BKP 또는 기타 조합 최적화 문제에 대한 솔루션을 근사화하는 데 유용한 접근 방법입니까? 적기 스타일의 접근이 효과적인지 제안하는 문제 (구조적 / 통계적 / 기타 등)의 특정 특성이 있습니까?

솔루션 공간의 특성으로 인해 산적 방법에 완전히 저항하는 알려진 결정 론적 문제가 있습니까?

답변:


7

이것은 완전한 대답은 아니지만 이것을 MAX-SAT에 적용하는 것에 대한 몇 가지 기본 관찰입니다.

7/8x=0x=1x=0x=17/87/8

7/8NP7/8완벽하게 추측하더라도 역 추적을 통해 기하 급수적으로 많은 단계를 거친 후에 만 ​​만족할 수없는 결론을 내리는 만족할 수없는 공식이 여전히 있습니다. 분해능 증명 길이의 하한은 이러한 결과를 산출합니다. 한 가지 참조는 다음과 같습니다.

Pavel Pudlák, Russell Impagliazzo : k-SAT (예비 버전)에 대한 DLL 알고리즘의 하한. SODA 2000 : 128-136



2

이 최근 설문 조사는 7.8 절에서 MCTS를 게임 이외의 여러 검색 및 최적화 문제에 적용한 내용을 나열합니다.

http://pubs.doc.ic.ac.uk/survey-mcts-methods/survey-mcts-methods.pdf

http://ieeexplore.ieee.org/xpl/freeabs_all.jsp?arnumber=6145622

적기 기반 방법에 대해 완전히 내성 인 도메인에 관해서는, 나는 다른 편견을 모른다. 체스는 MCTS 문헌에서 눈에 띄지 않는 검색 중 하나입니다. 검색을 손상시키는 "트랩 상태"때문일 수도 있지만 요즘 컴퓨터 체스 플레이어가 매우 최적화되고 우수하여 새로운 접근 방식을 만들지 않을 수도 있습니다. 그들에 찌그러짐.

감사합니다, 카메론

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.