AlphaZero의 Stockfish에 대한 승리로 인해 체스 전문가들은 왜 놀랐습니까?


10

그것은 한 최근 내 관심을 끌게 체스 전문가들은 화가의 무언가로이 지금은 유명한 경기의 결과를 걸렸다.

참조 : 체스의 새로운 최고 선수는 두려움이없고, 스와 시버 클링 알고리즘입니다

Chess and Chess AI에 대한 비전문가로서, AlphaGo의 성능과 조합 게임과 관련하여 이러한 유형의 방법의 검증에 기초하여, 오래된 AI는 기회가 없을 것이라고 가정했습니다.

  • AlphaZero의 승리가 놀라운 이유는 무엇입니까?

답변:


14

좋은 질문.

무엇보다도 Go 심문에는 도전 할 초인간적 상대가 없었습니다. Go 엔진은 최고 수준의 인간 플레이어 근처에 없었습니다. 그러나 체스에서 엔진은 최고 인간 플레이어보다 500 ELO 포인트가 강합니다. 이것은 큰 차이입니다. 현대 체스 엔진에 들어간 작업량은 엄청납니다. 우리는 프로그래밍에서 수백만 시간, 수십만 번의 반복에 대해 이야기하고 있습니다. 그것은 방대한 지식과 일입니다. 4 시간 안에이 모든 것을 극복하고 능가하는 것은 엄청납니다.

둘째, 체스 마스터에게는 놀라운 결과 그 자체가 아니라 AlphaZero가 체스를하는 방식입니다. 인간의 지식이나 전문 지식이없는 시스템이 우리처럼 가장 잘 작동한다는 것은 매우 아이러니 한 일입니다. 엔진은보기 흉한 움직임, 조화가 부족한 움직임 등으로 악명이 높습니다. 비 체크 연주자에게는 설명하기 어렵지만 현대 엔진과 같은 "인공 동작"과 같은 것이 종종 있습니다. AlphaZero는 이런 식으로 전혀 연주하지 않습니다. 그것은 매우 전략적인 플레이와 놀라운 위치 희생으로 상대방의 작품을 지배하는 매우 인간적인 스타일을 가지고 있습니다. AlphaZero는 정밀한 위치 이해와 엔진 계산의 정밀성을 결합하여 우리가 열망하는 방식을 수행합니다.

편집 아, 나는 결과 자체에 대해 언급하는 것을 잊었다. 당신이 컴퓨터 체스에 익숙하지 않다면 그것은 비틀 거리는 것처럼 보이지 않을 수도 있습니다.

요즘 최고의 현대 엔진을 분리하는 승리의 여백은 얇습니다. 100 경기에서 당신은 더 나은 엔진을 결정하기 위해 85 게임, 9 승리 및 6 손실과 같은 결과를 기대할 수 있습니다.

제로 손실을 기록한 AlphaZero 28 승과 72 무승부는 전 세계적으로 쇄도했고 그 순간까지는 완전히 생각할 수 없었습니다.


좋은 대답입니다. AI의 re Chess 비교에 대한 당신의 요점은 Chess의 loopiness와 Win / Loss / Draw triad에 기반한 한계의 관점에서 흥미 롭습니다. (미래에는 결과 측면에서보다 세밀한 분석이 가능한 유한하고 다루기 힘든 게임이 필요할 것입니다.) 저는 체스 엔진의 역사와 그에 들어간 엄청난 노력과 인간의 지식에 익숙하지만 성공의 부족이라는 맥락에서 : 훨씬 복잡한 19x19 바둑은 저에게 반대의 충격을주었습니다.
DukeZhou

특히 AlphaGo가 훨씬 더 복잡한 게임에서 최고의 인간을 이길 수 있다면 최고의 인간뿐만 아니라 다른 모든 게임에서 최고의 AI를 이길 것이라고 합리적으로 보였습니다.
DukeZhou

인공적인 움직임에 관한 내용은 매우 중요하며, 비 체스 플레이어가 이야기하는 내용은 아닙니다. +1
Stella Biderman

4

체스에 대한 MCTS는 거의 성공하지 못한 채 문학에서 시도되었습니다. AlphaGo의 접근 방식은 체스에서는 작동하지 않지만 체스에서는 작동 하지 않을 것이라고 가정 했습니다. 갑자기 구글은이 접근 방식이 효과가 있다고 발표했으며, 이는 세계에서 가장 강력한 체스 프로그램을 크게 능가하는 것으로 나타났습니다.

구글 이전에 모든 체스 프로그래머들은 엔진 프로그래밍에서 휴리스틱을 만드는 것이 기계 학습보다 더 나은 전략이라고 배웠다. 신경망을 어떻게 구현 했더라도 64 비트 비트 보드 명령보다 빠른 속도로 실행되지는 않았습니다. AlphaGo는 꽤 느리게 실행 되었지만 가장 강력한 체스를했습니다.


2

나는 당신이 제공하는 기사를 바탕으로 승리에 대한 많은 놀라움을 보았습니다.

체스는 마스터하기 어려운 게임이며 상대편은 세계 최고의 관행을, AlphaZero는 tabula rasa를 사용했습니다.

학습에는 4 시간이 걸렸으며 AlphaZero는 100 점을 잃지 않았습니다.

플레이 스타일은 움직임과 같은 인간과 컴퓨터의 외계인 혼합, 공격적이며 때로는 몰랐지만 실제로 미래 상태를 더 강하게 만드는 희생으로 구피처럼 보입니다.

한 번의 움직임으로 고려할 수있는 가능성은 상대편보다 적었고, AlphaZero는 신비한 직감이나 직관을 가지고있었습니다.

화가 난 느낌은 AlphaZero가 자체적으로 구축 한 교육 자료의 양과 시간 제한으로 인해 기존의 기계에 상당한 시간을 제공하지 못했습니다.


아아 새로운 AI 방법에 대한 확신이 부족했기 때문입니다. 말이 되네요
DukeZhou
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.