«combinatorial-games» 태그된 질문

4
강화 학습에서 잘못된 움직임을 처리하는 방법은 무엇입니까?
5in-a-row / gomoku를 재생할 수있는 AI를 만들고 싶습니다. 제목에서 언급했듯이 강화 학습을 사용하고 싶습니다. 내가 사용 정책 그라데이션 기준으로, 즉 강화, 방법. 가치와 정책 함수 근사를 위해 신경망을 사용 합니다 . 그것은 컨볼 루션되고 완전히 연결된 레이어를 가지고 있습니다. 출력을 제외한 모든 레이어가 공유됩니다. 정책의 출력 계층에는 (보드 크기) 출력 …

1
Tic Tac Toe와 같은 게임에서 신경망 대 유전자 알고리즘?
현재 저는 Gomoku 게임을하기 위해 AI를 만드는 프로젝트를 수행하고 있습니다 (tic tac toe와 같지만 15 * 15 보드에서 플레이하고 승리하려면 5 연속을 요구합니다). Q 학습을 사용하고 테이블에 게임 상태 / 액션을 저장하여 완벽한 틱택 토 AI를 이미 성공적으로 구현했지만 15 * 15 보드의 경우 가능한 게임 상태가 너무 커져이 프로젝트를 …

1
체스와 같은 게임에 강화 학습을 적용하는 것에 관한 몇 가지 의심
체스 같은 보드 게임을 발명했습니다. 자율적으로 재생할 수 있도록 엔진을 만들었습니다. 엔진은 기본적으로 의사 결정 트리입니다. 다음과 같이 구성됩니다. 각 노드에서 가능한 모든 법적 움직임을 찾는 검색 기능 보드 위치에 숫자 값을 할당하는 평가 기능 사전 정리 부정 알고리즘 이 엔진의 주요 문제점은 평가 기능의 최적화가 실제로 까다 롭다는 것입니다. …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.