순전히 자기 훈련 된 체스 AI


46

내가 이해하는 한, 움직이기 전에 모든 강력한 체스 소프트웨어가 나타납니다.

  1. 수천, 수백만 개의 가능한 미래 위치를 조사합니다.
  2. 평가 함수 라고하는 일부 휴리스틱에 따라 각 미래 위치를 평가합니다.
  3. 개별적으로는 각 미래의 위치를 평가 정지, 위치의 연속성을 탐험 여부를 결정하기를,
  4. 사용 가능한 움직임 중에서 minimax 로 선택합니다 .
  5. 오프닝 북을 사용합니다 .

여태까지는 그런대로 잘됐다. 그러나 체스 프로그램의 강점은 주로 평가 및 정지 휴리스틱의 품질과 컴퓨터 관점에서 볼 때 아직 또 다른 휴리스틱 인 오프닝 북에 의존하는 것으로 보입니다. 그러한 체스 프로그램은 휴리스틱을 만든 사람과 마찬가지로 게임에 대해 많은 것을 정확히 알고 있습니다. 프로그램에 대한 통찰력이없는 것 같습니다.

자신의 통찰력을 가진 체스 프로그램을 작성한 사람이 있습니까? 그것은 그 자체로 게임을 배우는가? 그 자체 훈련? 이러한 프로그램에는 물론 게임 규칙이 제공 될 것이며 아마도 원시 미니 맥스 및 정지 인프라가 추가로 제공 될 것이며 강제 배우자가 발견되면이를 인식하고 기소 할 수있을 것입니다. 그러나 휴리스틱은 제공되지 않습니다. 예를 들어, 중앙으로 게임을 열거 나 기사보다 루크를 선호하거나 시칠리아 방어는 무엇입니까? 그러한 원칙을 유추해야 할 것이다 (또는 아마도 더 나은 원칙을 발견하기 위해).

순수한 형태로, 그러한 프로그램은 공부할 마스터 게임은 제공되지 않고 자체 게임 만 제공됩니다. 한 번만 완전히 자기 훈련을 받으면 인간 경쟁에서 벗어날 수 있습니다.

그러한 순수한 체스 AI가 존재합니까? 기계식 체스 autodidact가 나타 났습니까? 실제로, 오래된 터크 는 스스로 가르 칠 수 있습니까?

여기에 실패한 순수한 체스 AI에 대한 간단한 통지가있는 것 같습니다.

( 이 사이트에는 접선과 관련된 질문 이 있으며, 체스 오프닝에 대한 전산화 된 연구에 관한 것입니다.)

최신 정보

이 글을 쓰는 시점에 @WesFreeman, @GregE의 세 가지 다른 답변으로 문제를 해결했습니다. 그리고 @Landei. 세 가지 모두를 강력히 권장하며 사이트 정책 에 따라 다른 하나를 배제하기 위해 공식적으로 하나를 수락 하면 죄책감을 느낄 것입니다. 이 세 가지에 대해 감사하고 감사를 표합니다.

질문은 간결성을 원합니다. 그러나 답변에 대한 응답이 더 길어질 수 있습니다. 따라서 관심있는 독자는 여기서 바로 답변으로 건너 뛰어 계속 관심이있는 경우 다음에 나오는 더 긴 업데이트를 읽을 수 있습니다.

질문을 할 때 다음과 같은 것을 염두에 두었습니다.

사람들이 체스에 대해 들어 본 적이없는 샹그릴라 외곽에있는 가상의 마을을 가정 해 봅시다. 짧은 방문 동안, 당신은 마을 장로들에게 게임의 규칙을 가르치지 만, 게임의 어떤 원칙에도 지시하지 마십시오. 두 명의 장로들은 나머지 장로들이 지켜 보면서 게임을하며, 키비 칭으로 플레이를 중단하고 싶지 않은 경우 규칙에 대한 질문에 의견을 제시합니다. 샹그릴라에 머무르는 동안 사후에 게임을하거나 체스를 다시하거나 토론하지 않습니다. 그러나, 당신이 떠날 때, 절대 돌아 오지 않으면, 체스 세트를 남겨 둡니다.

부재시 장로들은 사람들에게 게임을 가르칩니다. 사람들 중 일부는 나중에 여가 시간에 약간의 놀이를하고, 일부는 자신 만의 체스 세트를 만드는 열정을 키우고 있습니다.

그런 마을 사람들에게는 루크가 기사보다 낫다는 것이 즉시 분명하지 않을 수도 있지만, 사람들은 여전히 ​​많은 게임을 통해 체스 맨의 상대적 강점을 점차적으로 해결할 수 있습니다. 마찬가지로, 그들에게 1. a4는 열악한 개방이라는 것이 명백하지 않을 수도 있습니다. 그들은 시도하고 결과를 고려할 수있었습니다.

게임에 대한 마을 사람들의 이해는 결국 외부 세계의 이해와 어느 정도까지 수렴 할 것인가? 오프닝 북이 부족하여 독자적인 오프닝을 개발할 수 있습니까? 물론, 처음에는 마을 사람들의 오프닝이 매우 좋을 것으로 기대하지는 않지만, 몇 세기의 고립으로 인해 마을 사람들 내가 아는 모든 사람들 에게 존경받는 오프닝 레퍼토리를 개발할 수 있습니다 .

200 년 후, 다음 여행자가 지나갔을 때 독자적으로 개발 한 개통 중 어느 것이 외부 세계에 흥미 로움을 나타내는가? Shangri-La가 전 세계에 새로운 소설 Shangri-La Defense를 제공 ​​할 수 있습니까?

그렇다면 체스 AI에 관한 나의 원래의 질문과 관련하여, 내가 생각했던 것은 이보다 더 많거나 적었다.

아래 @ 랜디의 답변에 대한 Sussman의 이야기를 고려할 때, 우리 마을 사람들이 게임에 특정 선입견을 가져올 것이라는 것은 의심 할 여지가 없습니다. 예를 들어, 그들은 유용한 것을 더 많이 소유하는 것이 일반적으로 그것을 소유하는 것보다 낫다는 것을 이해하게 될 것이므로 상대방의 체스 맨을 잡는 것이 아마도 자신의 체포를 겪는 것보다 일반적으로 바람직하다는 것을 이해하게 될 것입니다. 샹그릴라의 가상의 사람들이 본질 상 영토가 얼마나 영토 였는지는 문학의 문제이지만, 더 많은 공간을 명령 한 위치는 덜 명령 한 위치보다 우월하다고 인식 할 수 있습니다. 그리고 한때 체스 세트를 보여주고 게임 규칙에 지시 된 밝은 초보자는 여왕이 전당포보다 27 개까지 움직일 수 있다는 것만으로 여왕보다 폰이 더 낫다는 것을 유추 할 수 있습니다.

그러므로 제 질문은 체스 보드에 어떤 종류의 지식을 가져 오는 것에 대한 절대적이고 Sussman 스타일의 명령을 암시하는 것으로 해석 될 필요는 없습니다. 차라리 체스에 특화된 지식에 대한 일반적인 명령을 암시하는 것이다. 결국 (오래 전에 게임 규칙의 진화 문제를 무시하고) 과거에는 언젠가 체스의 첫 게임이 진행되었습니다. 첫 번째 플레이어가 1을 열었을 수도 있습니다. a4; 그러나 결국 그는 더 잘 배우고 제자들에게 배운 것을 가르쳤다. 카스파로프는 우리에게 더 많은 것을 배우고 세대마다 더 많은 것을 가르쳤습니다.

AI가 몇 세기가 아닌 몇 주 만에 그런 일을 할 수 없을까요?

플라톤은 회의적 일 것입니다. ume은 더 낙관적이지만 더 이상 철학만으로는 문제를 해결할 수 없습니다. 우리는 이제 제안을 테스트 할 수있는 전자 컴퓨터를 가지고 있으며 AI 아트의 상태가 무엇인지 궁금했습니다. 현재 최고의 체스 인공 지능은 아무 것도 직관적으로 사용하지 않으면 서 모든 사람을이기는 완전히 지능적이지 않은 전문가 시스템 인 것 같습니다. 어떤 의미에서 실제로 체스에 대해 생각하는 약간 더 넓은 AI가 게임을 가르치는 데 상당한 성공을 거두 었는지 궁금했습니다.

나는 그 대답이 '아니요'라고 대답합니다.


4
이것은이 사이트에서 가장 좋은 질문 중 하나입니다.
prusswan

5
DeepMind가 처음부터 훈련 한 새로운 상태의 체스 인공 지능 AI에 대한 연구를 발표 했으므로 이제 대답은 '예'인 것처럼 보입니다. arxiv.org/pdf/1712.01815.pdf
Lalaland

1
@Lalaland의 의견에 덧붙여, 훈련 후 10 시간이 마치 마치 마치 마치 마치 마치 생선이 초보자 인 것처럼 비축 품을 완전히 분쇄했다고 생각합니다. 엔진 대 엔진 게임에서는 거의 들어 본 적이 없습니다. alphago 제로 좋아하는 것 같다는 탈의 스타일로 재생
아리 아나

2
"AI는 몇 세기가 아니라 몇 주 안에 이런 일을 할 수 있을까? 아마 그렇지 않을 것이다." 글쎄, 당신은 어떤 식 으로든 옳았습니다 ... 시간이 걸렸습니다.
user230452

1
Capablanca와 같은 몇몇 플레이어는 한 번 플레이 한 것을보고 게임을 알아 내야합니다. 그리고 알파 제로는 다른 생각이 없었습니다.
Philip Roe

답변:


26

매우 흥미로운 점이 있습니다. 인공 지능 연구 (제 M.Sc.가이 분야에 있었음)에 대해 약간의 경험이 있으므로 통찰력을 제공 할 수 있다고 생각합니다.

인근에있는 연구

우선,이 분야에 대한 연구가 확실히 진행되고 있습니다. "진화론 접근 체스"에 대한 검색 은 2001 년부터이 논문 과 함께 돌아 왔으며 , 여러분이 제안한 것을 거의 정확하게 수행하고, 최소 / 최대 접근법을 남기고 평가 기능 만 수정했습니다. 더 많은 것을 파헤칠 수 있으며,이 분야에서 일반적으로 일하고있는 몇몇 사람들을 알고 있습니다.

이론적 가능성

제 생각에는 AI를 재생하는 "순수한"체스를 만들기위한 유일한 제한 요소는 계산 시간입니다. 이론적으로 현재 AI를 사용하여 이러한 AI를 만들 수없는 이유는 없습니다.

실용성

체스 휴리스틱 기능을 발전시키는 데 진화 또는 유전 적 접근 방식을 사용하는 데는 두 가지 주요 문제가 있습니다. 첫 번째는 체스의 휴리스틱 기능이 가장 기본적이지만 체스에 대한 휴리스틱 기능이 매우 복잡 하다는 것 입니다. 우리는 수백 가지 규칙, 부분 평가 (위치 등에 따라 다를 수 있음), 위치 분석 등을 말하고 있습니다. 이러한 규칙을 설명 할 수있는 유연한 컴퓨터 언어가 필요하며 이러한 규칙은 임의로 생성 될 수 있습니다. 변이, 서로 번식하는 등의 작업은 가능하지만 수천 개의 엔터티로 구성된 규칙 집합으로 끝날 것입니다. 그것은 동적으로 진화하기위한 매우 큰 규칙입니다.

두 번째 문제는 새로 수정 된 규칙을 실제로 평가하려면 체스 게임을하고 누가이기는지 확인해야한다는 것입니다. 이것을 "올바르게"하고 싶다면, 일반적인 게임 길이와 비슷한 두 플레이어가 생각할 시간을 충분히주고 싶을 것입니다. 그러나 한 상대 만 플레이하는 것만으로는 충분하지 않습니다. 게임 강도가 향상되었다는 사실을 확신하기 전에 여러 다른 상대, 심지어 같은 상대를 여러 번 플레이하고 싶을 수도 있습니다. 이것은 아마도 모집단에서 개인당 수백 개의 게임을하는 것을 의미하며, 이는 한 세대의 알고리즘을 제공합니다.

일반적으로 이러한 유형의 접근 방식을 사용하면 최소 수백 세대 또는 체스 휴리스틱, 수십만 (또는 수백만) 세대와 같은 복잡한 기능을 사용하게됩니다. 몇 가지 빠른 수학을 사용하면 단일 세대에 수천 시간의 CPU 시간이 필요하다는 것을 확신해야합니다. 심지어 규모가 큰 서버 팜을 확장하더라도 실제로 진화하려면 실제로 수백 년이 걸릴 것입니다. 업데이트에서 언급했습니다.

그 시간이 끝나면, 실제로 발견되지 않은 게임에 대한 수많은 통찰력을 가질 수있는 흥미로운 알고리즘을 갖게 될 것입니다. 그들이 인간에게 유용하거나 이해할 수 있는지 말하기는 어렵습니다. 규칙이 존재하는 이유는 무엇 입니까? 수천 개가 넘는 게임 때문에 작동하는 것 같습니다.

미래

컴퓨팅 성능이 향상됨에 따라 이러한 접근 방식이 더 인기를 얻게 될 것입니다. 현재 우리는 지능이 신중하게 수작업으로 만들어지면 기계가 (거의 모든) 인간을 이길 수있는 충분한 컴퓨팅 시간을 가지고있는 시점에 있습니다. 20 년 동안 프로세서가 너무 많이 움직여서 한두 번의 추가 깊이 이동으로 인해 더 이상 "하드 코딩 된"기계에 충분한 이점을 제공하지는 않지만 일반적으로 진화하고 이상하게 직관적 인 기계에 의해 극복 될 가능성이 있습니다. 그들 뒤에 수백만 시간의 진화.

2018 년 5 월 업데이트

Robert Kaucher가 아래 의견에서 언급 한 것처럼 최근 뉴스는 여기에서 언급 할 가치가 있습니다. 특히, Google의 AlphaGo 프로젝트는 이러한 유형의 게임에 대한 진정한 AI 기반의 첫 번째 접근 방식 인 것으로 보이며 2017 년 후반 에 작업 용도를 변경 한 후 StockFish 2 에 대해 이겼다고 주장합니다 .


감사합니다. 나는 당신이 링크 한 논문이 AI를 먼저 마스터가 아닌 인간의 상대에게, 나중에는 기존의 체스 소프트웨어에 대해 훈련 시킨다는 것을 알아 차렸다. 나와 같은 플라톤 주의자는 당신과 내가 논의하고있는 인공 지능의 종류가 실제 불가능하다는 사실을 알고 놀랄 일이 아닙니다 (우리는 이론적으로 불가능한 체스가 미니 맥스에 의해 해결 될 수 있기 때문에 이론적으로 불가능하지 않다는 것을 알고 있습니다). 그러나 대답이 나를 놀라게하는지 여부는 요점이 아닙니다. 중요한 것은 AI가 제안 된 위업을 달성했는지를 묻는 것입니다. 대답은 '아니오'인 것 같습니다.
thb

2
@thb 나는 이런 유형의 인공 지능에 대해 많은 시도가 있었다고 생각하지만, "성공하지 않은"것으로 생각할 수있다. 나는 (오늘) 매우 성공적인 시도가 아마 매우 약한 아마추어 수준에서 뛰고있을 것으로 생각한다. 대중의 눈이 아닌 위대한 업적. 또한 기존 프로그램과 인간에 대한 교육은 진화하는 AI의 플레이 스타일의 방향을 바꿀 수는 있지만 매우 큰 최적화 일 뿐이라고 속이는 것은 아닙니다.
Daniel B

1
"순수한"접근 방식에 대한 자세한 내용을 보려면 "경쟁적 공동 발전"접근 방식을 검색하는 것이 좋습니다. 이것은 외부 성능 측정을 제공 할 수있는 좋은 방법이 없을 때 (즉, 다른 체스 엔진과 경쟁 할 수없는 경우) 사용되는 문구이므로 다양한 버전의 자체를 재생하여 AI 교육을 발전시켜야합니다. 확실히 작동하지만 시간이 더 오래 걸리므로 아마도 덜 추구하는 접근법 일 것입니다.
Daniel B

1
@DanielB AlphaZero는 AI입니까?
Harry Weasley

1
답변을 업데이트 할 수 있습니다. chess.com/news/view/…
Robert Kaucher

17

나는 당신이 요구하는 것이 일종의 유전자 알고리즘 또는 진화 알고리즘 접근법 으로 분류 될 것이라고 생각합니다 . 프로그래머가 여전히 위치의 정적 기능 (재료 수, 폰 구조, 색상 복합물 등)을 정의해야하기 때문에 근본적인 수준으로 인간의 편견을 본질적으로 포함시키지 않고 그러한 알고리즘을 설계하는 현실적인 방법이 없다고 생각합니다. AI가 다른 게임의 위치를 ​​분류하고 비교하는 데 따라 체스와 관련하여 위의 알고리즘 용어에 대해 Google 검색을 수행하면 수많은 결과를 얻을 수 있지만 실제로는 성공적인 경쟁 AI를 구축하는 데 사용 된 심각한 연구 방법은 거의 없습니다.

사실, 무어의 법칙의 결과로, 컴퓨터는 이제 매우 정교한 AI 방법이 (최고의 인간 상대보다 높은 수준에서 플레이한다는 관점에서) 불필요 할뿐만 아니라, 반 생산적 일 수도있는 강력한 계산 기계입니다. 체스는 일종의 게임입니다. 주로 주어진 위치에서 합리적인 이동의 비교적 작은 검색 공간과 전술 조합 조합 (수표, 조각 캡처, 메이트 위협 또는 치명적인 재료 손실, 등)-보수적 인 검색 트리 가지 치기 기능을 갖춘 무차별 대입 방식은 알고리즘 적으로 가장 단순하고 가장 효과적인 방식입니다. 최종 게임 테이블과 책을 열 수 있다는 점을 고려하면 그 접근 방식의 논리 만 커집니다. 나는 거기에 sa는 아직도 당신이 이야기하고있는 새로운 인공 지능 (AI)에 대한 이론적 관심과 잠재적 가치를 많이 가지고 있지만 체스는 그것을 개발하기에 잘못된 영역이라고 생각합니다. 다른 한편으로, 전술적으로 덜 전술적이고 무차별 접근 방식을 실용적이지 않게 해주는 검색 공간을 포함하는 Go와 같은 게임은 최첨단 AI 연구의 더 나은 후보가 될 수 있습니다.


귀하의 답변에 비추어 AI 질문을 업데이트했습니다. 업데이트는 짧지 않으므로 선택에 따라 시간이있을 때 관심이있는 범위까지 업데이트를 검토 할 수 있습니다.
thb

2
그러한 인간 편견은 필요하지 않습니다. 합법적 인 체스를 할 수있는 1000 개의 랜덤 알고리즘을 생성하고 토너먼트에서 서로 경쟁하여 상위 20 %를 차지하고 돌연변이와 크로스 오버를 적용하여 차세대를 구축하십시오. 여러 세대에 걸쳐 여러 인구에 걸쳐 반복하면 결국 절반 정도 괜찮은 수준이어야합니다. 필요한 유일한 운동 기능은 승리 / 손실입니다.
superluminary

15

일반 게임 플레이 에 관한 Wikipedia 페이지를 참조하십시오 . 활발한 연구 분야입니다. 프로그램에 새로운 게임의 규칙이 주어지고 잠시 동안 그것에 대해 생각한 다음 서로 게임을하는 GGP 토너먼트가 매년 있습니다.

체스 규칙을 GGP 프로그램에 제공한다면, 그것은 사람이 초보자보다 훨씬 강력하고, 의도적으로 작성된 체스 프로그램보다 훨씬 약하다는 것을 알게 될 것입니다.


13

Stockfish 8에 대해 최근 AlphaZero의 놀라운 성공을 고려 하여이 질문을 다시 살펴볼 가치가 있습니다. DeepMind의 AlphaGo 및 AlphaGo Zero 프로그램 의 추가 발전 인 AlphaZero는 지구상에서 가장 강력한 "전통적인"체스 엔진 중 하나에 대해 +28 = 72 -0의 놀라운 점수를 기록했습니다.

AlphaZero는 강화 학습을 통해 자신에게 대항하는 일련의 게임을 통해 신경망 아키텍처를 훈련시키는 법을 배웠습니다. 첨부 된 논문 에 따르면 :

  1. 위치를 설명하는 입력 특징과 이동을 설명하는 출력 특징은 평면 세트로 구성됩니다. 즉, 신경망 아키텍처는 보드의 그리드 구조와 일치합니다.
  2. AlphaZero에는 게임 규칙에 대한 완벽한 지식이 제공됩니다. MCTS 중에는 일련의 동작으로 인한 위치를 시뮬레이션하고, 게임 종료를 결정하고, 터미널 상태에 도달하는 시뮬레이션을 점수화하는 데 사용됩니다.
  3. 규칙에 대한 지식은 입력 평면 (예 : 거세, 반복, 진행하지 않음) 및 출력 평면 (조각의 이동, 승격 및 조각 낙하 방법)을 인코딩하는 데에도 사용됩니다.
  4. 탐사 소음의 크기를 조정하기 위해 일반적인 법적인 움직임이 사용됩니다 (아래 참조).
  5. 최대 단계 수 (일반적인 게임 길이로 결정)를 초과하는 체스 및 쇼기 게임이 종료되고 결과가 도출되었습니다. Go 게임은 이전 작업과 마찬가지로 Tromp-Taylor 규칙으로 종료되고 점수가 매겨졌습니다 (29).

AlphaZero는 위에 나열된 사항을 넘어서는 어떠한 형태의 도메인 지식도 사용하지 않았습니다.

"- 내가 사용하는 사람이 다른 하드웨어와 같은 것들에 대해 의문을 제기 할 수 있습니다 확신 AlphaZero를 ... 4 단일 시스템을 사용 TPU에 . 건어 ... [그] 강한 64 개 스레드를 사용하여 기술 수준 및 해시 크기로 재생 1GB. " -그러나 어떤 경우에도 AlphaZero의 결과는 주목할만한 결과이며 OP의 맥락에서 매우 큽니다.

AlphaZero는 체스에서 Stockfish를 때리는 것뿐만 아니라 도메인 특정 지식이 얼마나 적게 사용되는지에 대한 더 많은 지원을 공개하면서, 쇼기에서 챔피언 프로그램 Elmo를 최고점까지 훈련했으며 물론 이전 Gogo in AlphaGo Zero를 능가했습니다. .

여기에 베를린의 Stockfish와의 게임 중 하나가 있습니다. 베를린은 재료 불균형이 결국 AlphaZero이며 기사에 대한 주교 쌍과 이후에 Stockfish의 폰이 31.Qxc7있습니다. 그 자리에서, AlphaZero의 모든 작품은 뒤쳐지고 주교는 원래 사각형으로 돌아갑니다. 결국, 여왕들이 검은 조각을 벗기고 나면 천천히 흰 말을 들기 위해 천천히 움직입니다.

스톡 피쉬-AlphaZero, 2017-12-04, 0-1
1. e4 e5 2. Nf3 Nc6 3. Bb5 Nf6 4. d3 Bc5 5. Bxc6 dxc6 6. OO Nd7 7. Nbd2 O-O 8. Qe1 f6 9. Nc4 Rf7 10. a4 Bf8 11. Kh1 Nc5 12. a5 Ne6 13. Ncxe5 fxe5 14. Nxe5 Rf6 15. Ng4 Rf7 16. Ne5 Re7 17. a6 c5 18. f4 Qe8 19. axb7 Bxb7 20. Qa5 Nd4 21. Qc3 Re6 22. Be3 Rb6 23. Nc4 Rb4 24. b3 a5 25. Rxa5 Rxa5 26 Nxa5 Ba6 27 Bxd4 Rxd4 28 NC4 RD8 29 G3 H6 30 Qa5 BC8 31 Qxc7 BH3 32 사포닌 Rg1 RD7 33 Qe5 Qxe5 34 Nxe5 RA7 35 NC4의 G5 36 RC1 Bg7 37. Ne5 Ra8 38. Nf3 Bb2 39. Rb1 Bc3 40. Ng1 Bd7 41. Ne2 Bd2 42. Rd1 Be3 43. Kg2 Bg4 44. Re1 Bd2 45. Rf1 Ra2 46. ​​h3 Bxe2 47. Rf2 Bxf4 48. Rxe2 Be5 49. Rf2 Kg7 50. g4 Bd4 51. Re2 Kf6 52. e5 + Bxe5 53. Kf3 Ra1 54. Rf2 Re1 55. Kg2 + Bf4 56. c3 Rc1 57. d4 Rxc3 58. dxc5 Rxc5 59. b4 Rc3 60. h4 Ke5 61 hxg5 hxg5 62. Re2 + Kf6 63. Kf2 Be5 64. Ra2 Rc4 65. Ra6 + Ke7 66. Ra5 Ke6 67. Ra6 + Bd6 0-1

11

그런 AI를 생산하기 어려운 주된 이유는 "트레이닝"을 효과적으로 저장하는 데 필요한 공간 때문입니다.

또한 (자체 훈련 의견에 대한 응답으로) 그러한 인공 지능을 개선하려고 시도하는 동안 자기 훈련이 해로울 수 있습니다. 나는 틱택 토 (약간 더 간단 함)로 몇 가지 연구를 수행했으며 모든 종류를 발견했습니다. 양측이 끔찍하게 플레이했기 때문에 이길 수있는 끔찍한 방법 (그리고 그 끔찍한 방법을 훈련). 틱택 토를 사용하는 AI에 대해 교육하는 것보다 자체 교육을 통해 합리적인 성능을 얻는 데 훨씬 오래 걸렸습니다.

그러나, 심층 검색과 "트레이닝"을 모두 사용하는 하이브리드 (종종 게임과 오프닝 대신에 미들 게임 위치 데이터베이스)를 보는 것이 흥미로울 것이라고 생각합니다. 많은 공간이 필요합니다.

어쩌면 당신은 위치 승 / 손실 / 무승부보다는 위치 개념을 배우는 좀 더 "실제적인"AI 접근법을 생각하고있을 것입니다. 그러나 그것이 강력한 엔진과 비교할 때 매우 효과적이라고 생각하지 않습니다.


답을 부탁드립니다. 내가 생각한 것은 (a) minimax 기능을 가지고 있지만 (b) 사전 결정된 평가 기능이없는 AI였습니다. 그러한 AI는 순수한 minimax에 의한 틱택 토와 같은 작은 게임을 반드시 해결해야합니다. 이론적으로 미니 맥스에만 영향을받는 게임 인 체스에서는 AI가 보드의 현재 위치가 아니라 향후 위치를 평가 한 후 미니 맥스가 움직임을 선택합니다. Nimzowitsch는 알려진 평가 휴리스틱을 쫓아 체스에 혁명을 일으킨 것으로 느슨하게 말할 수 있습니다. 그렇다면 기계도 마찬가지로 할 수 있습니까?
thb

1
그래서 당신은 그것이 자체 평가 기능을 개발할 것이라고 말하고 있습니까?
Eve Freeman

2
@thb, 프로그래머로서, 당신의 개념의 문제는 내가 볼 수있는 한, 그럴듯한 체스 AI는 평가 기능을 위해 완전히 빈 슬레이트로 시작할 수 없다는 것입니다. 패턴에 대한 게임을 분석하고 통계적 / 확률 적 방법 (예 : 베이지안 추론)을 사용하여 평가 및 의사 결정을 미세 조정하는 AI를 작성할 수 있지만 프로그래머는 주제, 위치 요인, 이동 시퀀스가 ​​패턴을 구성하는 요소를 식별해야합니다. 그리고 그들을 평가할 기준에 따라. 다시 말해서, 평가 기능의 기본 핵심은 여전히 ​​인간이 설계해야합니다.
Greg E.

1
예를 들어 win / loss / draw를 기반으로 모든 재료를 동일한 재료 값으로 시작하여 재료 값을 변경하려는 경우 유전자 미니 맥스 엔진이 무엇인지 알아 보는 것이 흥미로울 수 있습니다. 나는 엔진 제작자가 이미 기사 2.9와 주교 3.1을 만드는 것과 같이 이미 이것을 조정하려고 시도했을 것입니다.
Eve Freeman

1
@ thb, 나는 전문가가 아니지만 그것이 사실이라고 생각합니다. 연결된 AI조차도 프로그래머 편견에 의해 제약을받습니다. 원본 연구 논문을 읽으면 평가 기능을 교육하는 "기능 벡터"는 "수작업으로 신중하게 디자인 된"보드 기능으로 구성되어 있습니다. 즉, 프로그래머는 AI가 의사 결정을 기반으로하는 정적 위치 요인 세트를 지정해야합니다. 이 특정 프로젝트에서 신경망의 주요 장점은 훈련을 병렬화 할 수있어 대량의 게임을 효율적으로 비동기식으로 처리 할 수 ​​있다는 것입니다.
Greg E.

10

그렉과 웨스의 대답을 여기에서 확장하고 싶습니다. thb가 제안하는 AI는 단순히이 애플리케이션에 필요한 정교함과 함께 존재하지 않습니다. 그리고 그들이 그렇게하더라도 나는 그들이 실패 할 것으로 의심합니다. 마치 thb는 게임의 기본 규칙을 가르친 다음 보낼 수있는 강력한 범용 AI를 원하는 것처럼 보입니다. 그러나 개발중인 범용 AI를 살펴보면 1 ~ 2 세 레벨에서 객체 및 음성 인식과 같은 것을 배우게됩니다. 모든 범용 AI는 먼저 게임 방법을 이해하기 전에 게임이 무엇인지 이해할 수 있도록 정교함을 가져야합니다. 범용 AI를 설계 할 수 없으며 협소하거나 전문화 된 AI처럼 작동 할 것으로 기대합니다. 일반적인 목적의 인공 지능은 사람처럼 체스를 배워야 할 것이며 체스 역사에 대한 지식이없는 두 명의 초보자 플레이어가 함께 자발적으로 오프닝과 전략적 테마를 재창조 할 것을 기대할 수는 없습니다. 서로 수백 개의 AI 인스턴스가 서로 재생되며 각각 수십만 번의 반복되는 모든 게임의 과거 데이터에 액세스 할 수 있습니다. 그리고 각 AI는 서로 다른 수준으로 가중치를 부여한 특정 특성을 가져야합니다.

로드리고 (루이) 로페즈 데 세 구라페드로 다미 오오 에서 폴 모르 피 까지 가는데 약 500 년이 걸렸고 , 스타이 니츠알레 카인 의 경기 사이에 일어난 변화를 고려하기까지. 그리고 이러한 변화는 스타일과 패션에 대한 언급이 아닌 다른 기질과 다른 영향을 미치는 특성 (예 : 주교보다 기사를 선호하거나 기사보다 주교를 무작위로 선호하는 등)을 가진 수십만 명의 플레이어의 역 동성을 통해 발생했습니다. 이 모든 것들이 수세기에 걸쳐 체스에 영향을 준 변화의 발전기에 기여했습니다. 약한 AI, 심지어 약한 범용 AI조차도 욕망이 없기 때문에 그런 종류의 발전기를 복제 할 수 없습니다. 욕망 만이 며칠 동안 몇 시간 동안 앉아있는 무언가를 몰아 내어 파열하거나 경쟁자가 그것을 파열시킨 후에 그것을 개선 할 의도 로 개구부를 분석 할 수있다. 실제로 수백 년 동안 게임을 개선 한 것은 분석과 준비를위한 일종의 원동력입니다.

그것은 영어를 못하는 사람들과 모국어 문학의 주인을 읽지 않는 사람들을 제 2 언어로서 영어로 방에 넣고 셰익스피어의 작품과 같은 것을 내놓기를 기대하는 것과 같습니다. 절대 일어나지 않을 것입니다.

편집 : 나는이 주장 이 일어났기 때문에이 주장을하는 것보다 더 잘 알고 있어야 했다 .

Chess.com은“AlphaZero는 전통적인 의미에서 게임을 '학습'하지 않았습니다. “이것은 오프닝 북, 엔드 게임 테이블, 센터 폰과 사이드 폰의 미세한 차이를 설명하는 복잡한 알고리즘이 없다는 것을 의미합니다. 로봇은 수천 개의 금속 비트와 부품에 접근 할 수 있지만 연소 엔진에 대한 지식은 없지만 페라리를 만들 때까지 가능한 모든 조합으로 여러 번 실험합니다. … 프로그램은 4 시간 동안 여러 번 연주되어 자신의 교사가되었습니다.”

나의 계속적이고 명백한 근거없는 욕설 :

우리는 세상에 대한 모든 암묵적 지식을 당연하게 여깁니다. 나무 조각과 못을 사용해야 할 경우 망치보다 스크루 드라이버보다 망치가 더 유용하다는 것을 이해하려면 먼저 특정 상황에서 다른 종류보다 상황이 더 유용하다는 것을 이해해야합니다. 또한 목표에 적용 할 수있는 용도가 있다는 것을 이해해야합니다. 이들은 휴리스틱입니다. AI가 특정 조각이 다른 조각보다 가치가 더 높다는 것을 알 수 없다면 어떻게 짝이 무엇인지 이해할 수 있습니까? 특정 휴리스틱으로 프로그래밍 할 수없는 경우 "가치"및 "유틸리티"양식 경험과 같은 아이디어를 추정 할 수 있어야합니다. 그리고 그것은 좁은 AI의 영역이 아닙니다. 일반적인 목적, 강력한 AI의 영역입니다.


1
훌륭한 답변입니다. 나는 당신의 첫 번째 문단이 내가 만나려고한다는 생각을 실제로 결정화한다고 생각하지만, 더 큰 명쾌함을 가지고 그렇게합니다.
Greg E.

고마워, 그렉 나는 약한 범용 AI에 대해 이야기하고 있다고 덧붙이고 싶습니다. 진정한 Strong AI는 압축 된 시간 프레임에서 여러 번 반복하여 여러 인스턴스를 통해 이와 같은 작업을 수행 할 수 있다고 생각합니다. 그러나 아직 강력한 AI는 없습니다. en.wikipedia.org/wiki/Strong_AI
Robert Kaucher

나는 욕망에 관한 부분을 제외하고 당신이 말한 모든 것에 동의합니다. AI는 설계자가 원하는대로 무엇이든 할 수 있습니다. 컴퓨터 전원으로 체스를 해결할 수는 있지만 아직 충분한 전력이 없습니다.
Eve Freeman

우리는 사실이지만, 우리는 "프로그래머"의 편견을 AI에 주입하고 있습니다. 질문의 저자가 원하지 않는 것 중 하나입니다.
Robert Kaucher

@EveFreeman, 나는 당신이 내가 말하는 것을 오해하고 있다고 생각합니다. 나는 컴퓨터가 "체스를 해결하지 않을 것"이라고 말하는 것이 아니라 , OP 의 특정 시나리오가 작동하지 않을 정도로 혼란 스럽다고 말하는 것입니다. 시스템에 휴리스틱이없는 경우 어떻게 가치를 높일 수 있습니까?
Robert Kaucher

9

다음 AI Koan에 대해 묵상하십시오 :

Sussman이 초보자였던 시절에 Minsky는 PDP-6을 해킹하면서 한 번 그에게 왔습니다. 민스키가 물었습니다. Sussman은“나는 Tic-Tac-Toe를 재생하기 위해 무작위로 유선 신경망을 훈련하고있다. “왜 그물이 무작위로 유선입니까?”라고 Minsky가 물었습니다. Sussman은“게임 방법에 대한 선입견을 갖고 싶지 않다”고 말했다. 민스키는 눈을 감았 다. "왜 눈을 감 으세요?"Sussman은 선생님에게 물었습니다. “방이 비워 지도록”그 순간 Sussman은 깨달았습니다.

우리의 응용 프로그램은 항상 눈을 감아 여부에 관계없이 선입견을 가지고 있습니다 ...


당신의 일화는 가장 설득력이 있습니다. 관심있는 범위 내에서 일화가 업데이트를 통해 질문을 확장하라는 메시지를 표시했습니다. 시간이 있으면 위에서 볼 수 있습니다.
thb

8

자신의 통찰력을 가진 체스 프로그램을 작성한 사람이 있습니까? 그것은 그 자체로 게임을 배우는가? 그 자체 훈련?

예. Matthew Lai가 작성한 기린 체스 엔진을 확인하십시오 . 그는 컴퓨터 공학 석사 학위를위한 인공 지능 연구의 일환으로 체스 엔진을 썼습니다.

작년에 TalkChess 체스 프로그래밍 포럼 에서 많은 논의가있었습니다 . 나는 엔진이 대략 기린만큼 강한 체스 엔진 저자이기 때문에 알고 있습니다. 그러나 기린의 저자는 전통적인 기술을 사용하여 엔진을 구현했지만 기린의 저자는 "심층 신경망을 이용한 시간차 강화 학습"을 사용하여 엔진을 훈련했습니다. Matthew는 여전히 기존의 알파 / 베타 검색을 구현하여 동적으로 위치를 평가했습니다. 그의 혁신은 정적 인 위치 를 평가하도록 엔진을 훈련시키는 것 입니다. 이에 비해 엔진의 정적 평가 루틴에 특정 지식을 썼습니다.

긍정적 인 결과를 낳은 입자 떼 알고리즘 ( 기술 토론 링크는 블로그의 감사 페이지 참조)을 사용하여 평가 매개 변수를 조정하는 코드를 작성했습니다 . 그러나 이것은 매우 넓은 평가 매개 변수 공간 (10 ^ 150 이산 매개 변수 조합 순서)에서 오류를 최소화하는 것만 큼 엔진을 "학습"하게하는 작업이 아니 었습니다.

Matthew 는 TalkChess 포럼 에서 논문 을 토론합니다. 내가 올바르게 기억한다면 그는 DeepMind에서 Google을 위해 일하고 있습니다.

또한 Thomas Petzke의 블로그를 확인하십시오 . 그는 매우 강력한 체스 엔진 인 iCE를 작성했으며 유전자 알고리즘을 사용하여 엔진의 정적 평가를 개선했습니다. 인구 기반 증분 학습 과 같은 2013 년 및 그 이전의 게시물을 참조하십시오 .


포럼에 오신 것을 환영합니다! 하나 추가.
SmallChess


5

같은 Google 검색 같은 결과까지 설정할 수 있습니다 .

특히이 논문 을보고 싶을 것 입니다. 그들은 엔진에 조각 값과 같은 초기 데이터를 제공하므로 정확하게 요구하는 것이 아니지만 성능이 뛰어납니다.


흥미로운 IEEE 인용문에 감사하기 때문에 +1입니다. 나는 이미 NeuroChess 페이지에 대해 잘 알고있었습니다. 그래도 그 중 어느 것도 내가 생각한 것을하지 않는 것 같습니다.
thb

3

머신 러닝으로 가능합니다.

체스 엔진의 책을 열면 기계 학습이 사용됩니다. 엔진 은 책의 오프닝 라인을 재생하여 테스트 합니다. 한 라인이 다른 라인을 더 잘 비교하면 오프닝 트리에서 해당 라인을 승격시킵니다. 시간이 지나면 엔진 이 더 나은 라인을 배웁니다 .

개방 단계가 끝나면 엔진은 책 사용을 중지하고 평가 기능을 사용하기 시작합니다.


기계 학습을 사용하여 자체 학습 엔진을 구현하는 방법은 무엇입니까?

평가 기능이없는 을 사용하는 엔진을 상상해보십시오 . 그리고 책은 처음에 비어 있습니다. 따라서 엔진에는 체스에 대한 지식이 없습니다.

엔진은이 빈 책으로 게임을 시작하고 게임이 끝날 때까지 책을 닫지 않습니다. 게임이 끝날 때까지 오프닝 북을 사용하는 일반 엔진처럼 생각할 수 있습니다.

시간이 지남에 따라 불량 라인의 점수가 떨어지기 때문에 엔진은 통계적으로 최상의 연속성을 찾을 수 있습니다. 물론 좋은 책을 얻으려면 많은 게임을해야합니다. 나는 얼마나 많은지 모르지만 비현실적이라고 말할 수있는만큼 많습니다.

2017 년 12 월 업데이트 : 글쎄, Alpha Zero는 가장 강력한 엔진 중 하나 인 Stockfish를 실질적인 양의 게임 으로 이길 정도로 강하게 훈련함으로써 나에게 틀렸다는 것을 추측 합니다.


2

이 분야에서 무엇을 시도하든, 먼저 Turry의 이야기를 읽으십시오 : http://waitbutwhy.com/2015/01/artificial-intelligence-revolution-2.html

TL; DR; 요청 당 스포일러 버전 :

Turry의 이야기에서 Turry의 자체 학습 AI는 멋진 필기 노트를 작성해야하며, 인간은 멋진 필기 노트를 작성한다는 명백한 무해한 목표를 달성 할 필요가 없기 때문에 제거해야합니다. 인공 지능을 갖춘 자체 훈련 된 체스 엔진은 체스 기술을 향상시키는 명백한 무의미한 목표를 개선 할 필요가 없기 때문에 인간을 제거 할 가능성이 높습니다.


아마도 설득력이 없지만 당신의 대답은 흥미 롭습니다. 귀하의 조언에 대한 링크 된 기사 (둘 다)를 읽었습니다. 작가는 일부 밀짚 남자를 공격하여 자신의 사건을 약간 약화 시켰지만, 그는 사려 깊은 동료입니다. 나는 기사의 Turry를 매우 염두에두고 있다고 생각 하지 않는다 . 두 명의 플레이어가 40 회 정도의 개별 회전을하는 8x8 체스 판은 기본적으로 아주 간단한 경우입니다. AI가 체스에 대해 일반적인 방식으로 생각조차 할 수 없다는 것이 놀랍습니다. 반대로, 할당 된 판독 값 : Feser, Edward. 마지막 미신. 여전히 관심을 끌기 위해 +1입니다.
thb

1

그리고 AlphaZero가 있습니다. 완전히 새로운 세대의 체스 엔진을 축하하십시오


0

컴퓨팅 시스템을 다룰 때 의인화 된 용어를 사용하는 것은 전문적인 미성숙의 증상입니다

에서 우리가 진리를 어떻게 알 수 있습니까 그 상처를 수 있습니까? Edsger W.Dijkstra는 귀하의 질문에 대한 잘못된 가정을 요약합니다. 인공 지능은 인공적 일 수 있지만 인간의 관점에서는 지능이 아닙니다.

BBC1984 년 Reith 강의에서 미국의 철학자 John Searle 은 단단한 AI의 문제점을 정확히 설명합니다. 그의 주장에 대한 "너무 오랫동안, 듣지 않았다"요약은 "구문은 의미론이 아니다"이지만, 그럼에도 불구하고 적어도 2 개의 "맥주 캔 및 육류 기계 " 강의를 들을 것을 권장합니다 .

Dijkstra와 Searle이 30 년 전에 말한 내용을 파악하면 질문에 무엇이 잘못되었는지 인식하게됩니다.

자신의 통찰력을 가진 체스 프로그램을 작성한 사람이 있습니까? 그것은 그 자체로 게임을 배우는가?

인간은 "통찰"을 가지고 배울 수 있습니다. 컴퓨터는 할 수 없습니다. 원시인 마을은 수세기에 걸쳐 체스 개설 이론을 재현 할 수 있지만 컴퓨터는 그렇지 않습니다.


당신은 컴퓨터가 인간 수준의 지능에 도달하지 못하거나 심지어 "생각"과 "이해"가 인간을 위해 예약되어 있다고 주장합니까?
BlindKungFuMaster

@BlindKungFuMaster 위의 링크에서 "맥주 캔 및 육류 기계"를 듣는 데 어려움을 겪으면 John Searle의 생각을 분명히 알 수 있습니다. 그는 저를 설득하고 그의 견해를 공유했습니다.
브라이언 타워

AI 컴퓨터 프로그램에 대한 Searle의 단순한 이해는 1984 년 이후로도 변명 할 수 없습니다. 그러나 현대 AI 아키텍처는 인간의 마음의 아키텍처만을 모방하므로 아키텍처는 단지 "생각"이 아니라 구문 적으로 설명됩니다. "인간 두뇌의 힘과 동등한 힘 (아직 아님)"은 "학습"을 통해 많은 양의 데이터를 섭취 할 때 발생합니다. 이 단계에서만 시맨틱 컨텐츠가 캡처됩니다.
BlindKungFuMaster

따라서 차이가 큰 규칙 집만으로 이해를 시뮬레이션 할 수 있다고 가정하고 실제로는 방대한 양의 데이터에서 적절한 아키텍처로 의미 론적 컨텐츠를 캡처 할 수 있다는 가능성을 가정하여 차이니즈 룸 논란에 결함이 있습니다. 실제로, 이것은 자연 언어 처리가 오늘날의 모든 것입니다 : cs224d.stanford.edu/syllabus.html
BlindKungFuMaster

@BlindKungFuMaster 당신이 이해하지 못하는 나에게 나타나는 말의 핵심 단어가 있습니다. "시뮬레이션"이라는 단어입니다. 저는 35 년 동안 컴퓨터 소프트웨어 엔지니어로 일해 왔으며 그 동안 많은 시뮬레이터를 보유하고 몇 개를 저술했습니다. 시뮬레이터는 종종 프로젝트의 중요한 구성 요소이지만 실시간 프로젝트에서는 대상 장비를 완전히 대체하지 않습니다. 의심 할 여지없이 컴퓨터는 지능과 의미 이해를 시뮬레이션하는 데 탁월하지만 의식, 의지, 이해를 달성 할 수는 없습니다.
브라이언 타워

0

이 답변은 질문 후 4 년이 지난 원래의 질문에 대한 답변으로 제공됩니다. 앞서 주어진 답변을 대신하거나 대체하지 않습니다. 대부분의 초기 답변은이 답변보다 더 흥미 롭기 때문입니다. 그러나이 답변은 컨텍스트를 추가 할 수 있습니다.

내가 알 수있는 한, 대부분의 AI 연구는 내재적으로 생각과 이유가 단지 물질적 현상이거나 최소한 생각과 이유와 구별 할 수없는 결과는 반드시 물질적 과정에 의해서만 달성 될 수 있다는 전제를 부여하는 것으로 보인다. 나는 전제에 대해 이의를 제기하지 않습니다. 나는 단지 그것을 보이는 것을 관찰 전제.

그리고 결국 AI 연구에서 이것이 어떻게 전제가되지 않아야 하는가? 인공 지능 연구원은 재료 처리 과정에 상관없이 중요한 과정을 거쳐야합니다.

Duns Scotus, St. Thomas, Aristotle 및 Plato를 통해 현실주의 철학 학자 들은 마음의 이론에 관해 많은 이야기를했습니다. 칸트 (Kant)와 같은 대표자 들은 다른 말을했다. 인공 지능 연구는 아마도 칸트와 더 가까울 수 있지만, 이것이 학자들에게 잘못된 것은 아닙니다.

틀림없이, 거기입니다 하나님 -의 갭 본 종류의 대화에서이 시점에서 팝업 경향이 이의 아직 전문 철학자가 허수아비 하나님 -의 갭 반대 공격 것을 당신에게 말할 것이다, 이 반대는 철학을 공부하지 않아서 그들이 무엇을 말하는지 모르는 사람들에게만 유용한 경향이있다. 아리스토텔레스 (Aristotle)에 따르면, 그것은 자체 훈련 된 체스 AI 문제에 연루 될 수있는 공식 적이고 최종적인 원인 입니다. 그러나 Aristotlean 용어로 AI 연구원은 물질 , 특히 효율적인 인과 관계 에서 순수하게 작동합니다.(인간 트레이너가 개인적으로 공식적이고 최종적인 요소를 시스템에 가져 오는 한, 아마도 비스듬히 제외하고). 이유가 공식적이라면, 생각이 최종적이라면, Searle의 중국 방이 온톨로지 불가능한 것으로 판명되면, 이론 상으로는 순수하게 자체 훈련 된 체스 AI를 달성 할 수 없을 수도 있습니다.

나는 순전히 자기 훈련 된 체스 AI가 실제로 달성 될 수 있으며, 아리스토 틀린의 관점 에서이 문제는 단지 효율적인 인과 관계라는 관점에서 적절하게 구제 될 수있을 것이라고 생각한다. 나는 일반적으로 강력한 AI에 대해 회의적이지만 경험상 증명해야합니까? 아직 아무도 모른다.

의 철학 원인마음은 (더 실제적인 사람이다 AI 연구자들, 그리고 아마도 몇 가지로) 몇에 의해 파악, 미묘하다. 그러한 철학을 배우고 싶다면, 그만한 가치가 있습니다. 그러나 인터넷에서 그리고 종종 인쇄 될 때도 알려지지 않은 오해를 바탕으로 오해의 소지가있는 설명을 찾기가 매우 쉽습니다. 내 돈을 위해 오늘 주제에 대해 쓰는 최고의 입문 교사는 Edward Feser입니다. 그의 책은 합리적인 가격으로 인쇄되어 있습니다. 그에게서 훨씬 더 많은 것을 배울 수 있습니다.

그러나 Feser 박사조차도 현재 질문에 대해 권위있는 답변을 할 것이라고 의심합니다! 답은 여전히 ​​AI 실험실에서 입증되어야합니다.


-3

그들이 코드를 공개하기를 원하면 이야기 할 수 있습니다. 체스를 해결하는 것은 쉽지 않습니다. 알파는 반세기 안에도 그것을 해결하지 못할 것입니다. 재미있게도 여전히 1.d4를 재생합니다. 왜? 인간 게임에 대해 훈련을 받았기 때문에 인간 이론은 1.d4의 최고 성능을 제공합니다. 불쌍한 것은 1 ... c5는 정확히 8 개의 움직임으로 무승부를 달성합니다. 이제 그들은 알파가 시뮬레이션 된 오프닝 북을 사용하지 않았다고 믿기를 원합니다. 그들은 알파가 오프닝을 훌륭하게 연주했다고 말합니다. 예, 몇 가지 예외가 있습니다. 1.d4는 프로그램이 달성 한 수준의 지능을 확실히 말하지 못한다. 운 좋게도 SF는 오프닝 단계에서 훨씬 약합니다. :)


3
당신은 1. ... c5는 8 움직임에서 무승부를 달성하고 오프닝 단계에서 Stockfish는 약하다고 말합니다. 이러한 주장에 대한 언급을 제공해 주시겠습니까?
Pablo S. Ocal

1
1.d4는 프로그램이 달성 한 수준의 지능을 확실히 말하지 못한다. 1.d4 플레이어로서, 나는 나의 지능이 여기 모욕되고 있다고 생각해야하는지 궁금합니다.
Evargalo

그들은 코드를 공개하거나 자신의 결과를 재현하는 용지를 프로젝트를 발표하지 않았지만 시작했다 : lczero.org 당신은 심지어에서 진화 "AlphaZero"로 재생할 수 있습니다 play.lczero.org
Junyan 쑤
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.