«game-ai» 태그된 질문

4
강화 학습에서 잘못된 움직임을 처리하는 방법은 무엇입니까?
5in-a-row / gomoku를 재생할 수있는 AI를 만들고 싶습니다. 제목에서 언급했듯이 강화 학습을 사용하고 싶습니다. 내가 사용 정책 그라데이션 기준으로, 즉 강화, 방법. 가치와 정책 함수 근사를 위해 신경망을 사용 합니다 . 그것은 컨볼 루션되고 완전히 연결된 레이어를 가지고 있습니다. 출력을 제외한 모든 레이어가 공유됩니다. 정책의 출력 계층에는 (보드 크기) 출력 …


2
그리드 기반 게임을 배우기위한 신경망을위한 입출력 인코딩
나는 그 위에 깊은 신경망을 훈련시킬 의도로 간단한 장난감 게임을 작성하고 있습니다. 게임 규칙은 대략 다음과 같습니다. 이 게임에는 6 각형 셀로 구성된 보드가 있습니다. 두 선수 모두 보드에 자유롭게 배치하도록 선택할 수있는 동일한 모음이 있습니다. 위치와 구성에 따라 다른 유형의 조각 보너스 포인트를 배치하거나 상대방의 포인트를 줄입니다. 더 많은 …

2
AlphaZero는 AGI의 예입니까?
arxiv.org에 대한 DeepMind의 연구 논문 에서 : 이 논문에서 우리 는 게임 규칙을 제외한 추가적인 도메인 지식없이 체스와 쇼기뿐만 아니라 Go와 AlphaZero 라고하는 유사하지만 완전히 일반적인 알고리즘을 적용하여 범용 강화 학습을 보여줍니다. 알고리즘은 여러 도전적인 영역에서 초인적 성능을 달성 할 수 있습니다. 이것이 AlphaZero가 AGI (Artificial General Intelligence)의 예라는 것을 …

3
라운드 기반 보드 게임을 위해 신경망을 훈련시키는 방법?
틱택 토, 체스, 위험 또는 다른 라운드 기반 게임과 같은 라운드 기반 보드 게임을 위해 신경망을 훈련시키는 방법이 궁금합니다. 추론으로 다음 움직임을 얻는 것은 게임 상태를 입력으로 공급하고 출력을 현재 플레이어의 움직임으로 사용함으로써 매우 직설적 인 것처럼 보입니다. 그러나 그 목적을 위해 인공 지능을 훈련시키는 것은 그렇게 간단하지 않은 것 …

4
신경망이 거리 개념을 해결할 수 있습니까?
빨간색 픽셀과 파란색 픽셀을 제외한 검은 색 화면 인 게임을 상상해보십시오. 이 게임이 인간에게 주어지면, 먼저 화살표 키를 누르면 빨간 픽셀이 움직일 것입니다. 다음으로 시도 할 것은 빨간색 픽셀을 파란색 픽셀로 옮기는 것입니다. 이 게임을 AI에 제공하면 백만 번 시도한 후 실수로 파란색 픽셀로 이동하여 보상을 받기까지 무작위로 빨간색 픽셀을 …

1
체스와 같은 게임에 강화 학습을 적용하는 것에 관한 몇 가지 의심
체스 같은 보드 게임을 발명했습니다. 자율적으로 재생할 수 있도록 엔진을 만들었습니다. 엔진은 기본적으로 의사 결정 트리입니다. 다음과 같이 구성됩니다. 각 노드에서 가능한 모든 법적 움직임을 찾는 검색 기능 보드 위치에 숫자 값을 할당하는 평가 기능 사전 정리 부정 알고리즘 이 엔진의 주요 문제점은 평가 기능의 최적화가 실제로 까다 롭다는 것입니다. …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.