컴퓨터 체스에서 인공 지능을 사용하는 방법


19

일부 (역사적) 논문에서 체스는 인공 지능의 초파리라고 불립니다. 현재 연구에서 검색 알고리즘을 적용하는 것만으로 컴퓨터 공학이 최고 수준 이라고 생각하지만 AI 기술을 적용하고 실습 할 수있는 영역이 여전히 있다고 생각합니다.

간단한 예는 프로그램이 특정 유형의 위치에 적합하지 않기 때문에 오프닝에서 특정 동작을 사용할지 여부를 프로그램에 가르 칠 수있는 책 학습을 여는 것 입니다. 우리는 강화 학습의 형태를 사용하고 이것을 자동화 할 수 있습니다 : 나는 스스로 프로그램을하고 라인을 이길 확률을 높이고 라인을 잃을 확률을 줄일 수 있다고 가정합니다.

더 복잡한 예는 학습 평가 함수 를 사용하는 것입니다 (예 : 조각 제곱 테이블 의 값을 조정할 수 있음 ). 그러나 나는 생각하고있다 :

  • 엄청난 양의 현실적 위치가 있기 때문에 모든 소음이 주어집니다 (현실적인 개방 선의 양과 반대)
  • 그리고 컴퓨터 체스 게임의 비용 (지속 기간)과로드를 재생할 필요성이 있습니다.

어떻게 이것을 효과적으로 할 수 있습니까? (또는 신경망과 같은 다른 기술을 살펴 봐야합니다.)


3
표준 접근법은 알파-베타 전정 미니 맥스입니다. 휴리스틱으로. 이는 머신 러닝 제품군이 아니라 AI 제품군의 검색 제품군에서 가져온 것입니다.
Lyndon White

2
실제 체스 마스터는 기본적으로 이전에 플레이했던 모든 게임을 기억합니다. 그래서 그들은 강력한 메모를 가지고 있습니다.

2
반대 주장도 있습니다. 누가 말했는지 기억이 나지 않지만 이런 식입니다. 생물 학자들은 초파리에 대한 실험을 사용하여 생리학, 유전학 등에 대한 깊고 깊은 이해를 얻습니다. 인공 지능 사람들은 체스 게임을 더 잘하기 위해 체스 컴퓨터를 작성합니다. 이것은 컴퓨터 과학에 대해 전혀 가르쳐주지 않습니다. 그것은 생물 학자들이 초고속 초강력 초식 동물을 번식시키고 서로 싸우게하는 것과 같습니다.
David Richerby

그것은, 더 다양한 측면 WRT "인공 지능의 초파리"보다 생각할 수있다 ESP는 ~ 1997까지 정상 인간을 이길 결정적으로 일부러 고려, 그것은에 대한 연구가 등, 계속 은유를 WRT
vzn

답변:


16

체스의 전체 주 공간은 거대합니다. 대략 10 43 (Shannon 수 (Shannon, 1950) , ( Wikipedia )) 으로 추정 할 수 있습니다 .

당신이 제시하는 아이디어-게임을 배우기 위해 서로 놀고있는 강화 학습 요원-은 주사위 놀이-TD-Gammon (Tesauro, 1995) , ( Sutton & Barto의 강화 학습 장 ) 에 성공적으로 적용되었습니다 . 또한 신경망을 사용하여 게임의 가치 기능을 평가했습니다. 그러나이 문제는 주사위 놀이의 상태 수가 체스보다 현저히 적기 때문에 훨씬 간단합니다. 즉 18,528,584,051,601,162,496 ( 주사위 놀이 포럼 아카이브 스레드 ).

그러나, 처음 몇 번의 움직임만으로 게임을 끝내고 "좋은 오프닝"을 배우는 것을 목표로한다면 유사한 접근법으로 성공할 수 있습니다. 주요 문제는 개막 후 게임을 평가하는 것이 어려워 보입니다. 잘 알려진 오프닝 후 확립 된 위치와의 유사성 측정만으로는 충분하지 않습니다. 상대방이 바보 같은 움직임을한다면 위치가 그들로부터 멀어 질 수 있기 때문입니다. 따라서 학습 에이전트의 실수로 인한 것이 아니기 때문에 위치가 "잘못된" "는 좋은 결과로 평가되어야합니다.)

참고 문헌 :


1
실제로 가장 어려운 부분은 개방 결과를 득점하는 경험적 방법을 제시하는 것입니다. 다른 개구부는 다른 방식으로도 좋으므로 여러 허용 가능한 개구부가있을 수 있습니다.
JDong

3

교과서에서 AI 또는 ML의 가능한 (또는 이상한) 방법이 시도되었고 단순한 무차별 대항에 비해 거의 실패했다고 확신합니다.

저의 개인적인 관점은 체스 그 자체가 더 이상 현대 AI에 관심이 없다는 것입니다 ... 간단히 말하면, 그것은 현대 컴퓨터와 무차별 대입만으로 해결 되기 때문입니다 . 그래서, 더 효율적으로 해결하기 위해 "지능형"시스템을 개발할 필요가 없다고 생각하지 않습니다 (휴대 전화에서 잘 작동합니다). "지능적인"접근 방식이 존재합니다.


1
왜 이것이 다운 피트되었는지 확실하지 않습니다. 체스가 "해결되었다"는 주장은 컴퓨터가 어떤 가능한 위치도보고 완벽하게 평가할 수 없다는 점에서 다소 부정확합니다. 즉, iliasfl은 체스가 AI 연구에 대한 호소력을 잃어 버렸다는 사실에 주목했습니다. 우선, 최고의 컴퓨터 체스 프로그램은 충분한 처리 능력과 시간을 감안할 때 최고의 인간보다 훨씬 강력합니다. 이로 인해 프로그래머는 알고리즘이 얼마나 잘 작동하는지 평가하기가 점점 어려워집니다.
elixenide

1
고마워, 나는 무차별 힘이 해결책이라는 의미에서 해결되었다고 말했다. 물론 AI 커뮤니티 (일반적으로 여기가 아니라)는 그 "솔루션"에 만족하지 않습니다. 그러나 우리는 이미이 과제를 해결하기위한 "지능적인"행동을 제시하고 심지어 최고의 인간을 이길 수있는 전산 시스템을 가지고 있습니다. 개인적으로, 나는 체스를 공격하는 데 경력을 쌓은 현재의 많은 학자들이 은퇴 한 몇 년 후에 체스가 AI에 대해 논란이 될 것이라고 믿습니다.

나는 현재의 컴퓨터 체스 구현을 '무차별 힘에 의해 해결됨'이라고 부르지 않을 것입니다-그들은 여전히 ​​엄청난 양의 게임 상태를 검색하고 있지만, 강포하지 않은 힘의 많은 구성 요소가 있습니다. 물론, 그들은 다른 문제들에 잘 일반화 될 수있는 "인간 스타일"솔루션은 아니지만, "인간 스타일"체스 AI를 가지고 있다면, 그것은 수십 배나 더 작을 것입니다. 현재 전문화 ​​된 솔루션보다 효율적으로 사용하기 때문에 단순히 열등합니다.
Peteris

나는이 대답을 생각하고 그 의견은 아주 분명 구글의 AlphaZero에 의해 반박되었다 : en.wikipedia.org/wiki/AlphaZero은 그 수준에 도착 것으로, 시스템을 당신은 건어의 설치에 대한 비판을 수용하더라도 그들은 모든 경기를 운집 몇 시간의 훈련으로 분명히 우월합니다.
Kamal

2

AI 문제를 해결하는 방법을 결정하려면 그것을 정의해야한다는 점에 주목할 가치가 있다고 생각합니다. 여부는 완전 관찰 가능한 또는 부분적으로 관찰 가능한 것이 있는지, 그리고 결정적 또는 확률 / 기회.

체스는 또한 (체커 등을들 수 있으며, 예를 들어 이동) 결정적이다 (주사위 놀이, 독점 또는 예를 들어 포커와 달리) 마지막으로, 적 존재하고, 완전 관측 인해 다음 최고의 이동을 결정할 때 사용하기 유용하다 적대적 검색 의 유형을 MiniMax와 같은 알고리즘. 문제를 분류하면 어떤 종류의 검색 알고리즘을 적용 할 것인지 결정할 수 있습니다. 체스의 경우 Adversarial Search가 적합합니다.

특히 Minimax는

시간 복잡도는O(bn)

의 공간 복잡도 (깊이 우선)O(bm)

따라서 체스의 경우 b는 35이고 m은 100입니다. 알파-베타 차단과 같이보다 효율적으로 만드는 방법이나 전략이 있습니다.


이 맥락에서 주목할 가치가있는 것은, 체스를위한 최종 게임이 최대 몇 조각까지 이미 도표화되어 있다는 것입니다.
BartoszKP

이것은 일반적인 접근 방식이지만 기계 학습 방식은 아닙니다. 이 질문에는 기계 학습 태그가 사용됩니다.
Lyndon White

@Oxinabox는 예전에는 사실 이었지만, 제목이나 본문에서 머신 러닝 접근 방식에 관심이있는 곳은 언급하지 않았으며, 마지막으로 그가 생각한 접근 방식의 한 예를 공유 한 시점에서만 언급했습니다. 문제를 기계 학습이나 단일 학습 알고리즘 (NN)으로 제한 할 필요는 없습니다.
Iancovici

실제로, 이것은 좋다
Lyndon White

정확하게 말하면 체스는 완전히 관찰 가능하지 않습니다. 예를 들어, 우리가 모르는 위치를 감안할 때, 왕이나 루크는 이미 움직 였거나 움직이지 않습니다. 그러나 프로그래머는 움직이지 않는 왕 / 루크와 다른 왕 / 루크를 다른 인물로 차별화하는 위치 표현을 변경하여 완전히 관찰 가능하게 만들 수 있지만 약간의 어려움이 있습니다.
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.