틱택 토, 체스, 위험 또는 다른 라운드 기반 게임과 같은 라운드 기반 보드 게임을 위해 신경망을 훈련시키는 방법이 궁금합니다. 추론으로 다음 움직임을 얻는 것은 게임 상태를 입력으로 공급하고 출력을 현재 플레이어의 움직임으로 사용함으로써 매우 직설적 인 것처럼 보입니다. 그러나 그 목적을 위해 인공 지능을 훈련시키는 것은 그렇게 간단하지 않은 것 같습니다.
- 한 번의 움직임이 양호하거나 그렇지 않은 경우 등급이 없을 수 있으므로 한 번의 움직임 훈련이 올바른 선택이 아닌 것 같습니다
- 신경망을 훈련시키기 위해 전체 게임의 모든 게임 상태 (입력) 및 이동 (출력)을 사용하는 경우, 잃어버린 게임 내에서 모든 이동이 나쁜 것은 아니므로 올바른 선택이 아닌 것 같습니다
그렇다면 라운드 기반 보드 게임을 위해 신경망을 훈련시키는 방법이 궁금합니다. tensorflow를 사용하여 tic-tac-toe에 대한 신경망을 만들고 싶습니다.