게임
Connect-4 의 (거의) 표준 게임을 할 것입니다 . 불행히도, 그것은 대응 게임이며 누군가가 맨 아래부터 시작하여 매 두 번째 행에 검은 색 테이프를 놓았 으므로이 행 내에서 상대방의 움직임을 볼 수 없습니다.
이미 가득 찬 칸 내에서의 모든 움직임은 턴을 통과 한 것으로 간주되며, 게임이 6 * 7
턴 보다 오래 실행 되면 추첨으로 간주됩니다.
도전 사양
프로그램은 Python 3 함수로 구현해야합니다. 첫 번째 인수는 보드의 '보기'이며 알려진 보드 상태를 아래에서 위로 2D 행 목록으로 표시 1
합니다. 첫 번째 플레이어 2
의 이동, 두 번째 플레이어의 이동 0
, 빈 위치 또는 숨겨진 상대에 의해 움직입니다.
두 번째 인수는에서 색인 된 턴 번호 0
이며, 그 패리티는 어떤 플레이어인지 알려줍니다.
마지막 인수는 None
각 게임이 시작될 때 초기화되는 임의의 상태로, 턴 사이의 상태를 유지하는 데 사용할 수 있습니다.
플레이하고자하는 컬럼 인덱스의 2 튜플을 반환하고, 다음 턴에 새로운 상태를 반환해야합니다.
채점
승리는로 +1
, 무승부 0
및 로 계산 됩니다 -1
. 당신의 목표는 라운드 로빈 토너먼트에서 가장 높은 평균 점수를 얻는 것입니다. 확실한 승자를 확인하기 위해 필요한만큼의 경기를 진행하려고합니다.
규칙
모든 경쟁 업체는 한 번에 최대 하나의 경쟁 봇을 보유해야하지만 개선 할 경우 출품작을 업데이트해도됩니다. 봇을 턴당 1 초의 사고 시간으로 제한하십시오.
테스팅
다음은 참조 용으로 경쟁하지 않는 몇 가지 예제 봇과 함께 컨트롤러의 소스 코드입니다.
import itertools
import random
def get_strides(board, i, j):
yield ((i, k) for k in range(j + 1, 7))
yield ((i, k) for k in range(j - 1, -1, -1))
yield ((k, j) for k in range(i + 1, 6))
yield ((k, j) for k in range(i - 1, -1, -1))
directions = [(1, 1), (-1, -1), (1, -1), (-1, 1)]
def diag(di, dj):
i1 = i
j1 = j
while True:
i1 += di
if i1 < 0 or i1 >= 6:
break
j1 += dj
if j1 < 0 or j1 >= 7:
break
yield (i1, j1)
for d in directions:
yield diag(*d)
DRAWN = 0
LOST = 1
WON = 2
UNDECIDED = 3
def get_outcome(board, i, j):
if all(board[-1]):
return DRAWN
player = board[i][j]
strides = get_strides(board, i, j)
for _ in range(4):
s0 = next(strides)
s1 = next(strides)
n = 1
for s in (s0, s1):
for i1, j1 in s:
if board[i1][j1] == player:
n += 1
if n >= 4:
return WON
else:
break
return UNDECIDED
def apply_move(board, player, move):
for i, row in enumerate(board):
if board[i][move] == 0:
board[i][move] = player
outcome = get_outcome(board, i, move)
return outcome
if all(board[-1]):
return DRAWN
return UNDECIDED
def get_view(board, player):
view = [list(row) for row in board]
for i, row in enumerate(view):
if i % 2:
continue
for j, x in enumerate(row):
if x == 3 - player:
row[j] = 0
return view
def run_game(player1, player2):
players = {1 : player1, 2 : player2}
board = [[0] * 7 for _ in range(6)]
states = {1 : None, 2 : None}
for turn in range(6 * 7):
p = (turn % 2) + 1
player = players[p]
view = get_view(board, p)
move, state = player(view, turn, states[p])
outcome = apply_move(board, p, move)
if outcome == DRAWN:
return DRAWN
elif outcome == WON:
return p
else:
states[p] = state
return DRAWN
def get_score(counts):
return (counts[WON] - counts[LOST]) / float(sum(counts))
def run_tournament(players, rounds=10000):
counts = [[0] * 3 for _ in players]
for r in range(rounds):
for i, player1 in enumerate(players):
for j, player2 in enumerate(players):
if i == j:
continue
outcome = run_game(player1, player2)
if outcome == DRAWN:
for k in i, j:
counts[k][DRAWN] += 1
else:
if outcome == 1:
w, l = i, j
else:
w, l = j, i
counts[w][WON] += 1
counts[l][LOST] += 1
ranks = sorted(range(len(players)), key = lambda i: get_score(counts[i]), reverse=True)
print("Round %d of %d\n" % (r + 1, rounds))
rows = [("Name", "Draws", "Losses", "Wins", "Score")]
for i in ranks:
name = players[i].__name__
score = get_score(counts[i])
rows.append([name + ":"] + [str(n) for n in counts[i]] + ["%6.3f" % score])
lengths = [max(len(s) for s in col) + 1 for col in zip(*rows)]
for i, row in enumerate(rows):
padding = ((n - len(s)) * ' ' for s, n in zip(row, lengths))
print(''.join(s + p for s, p in zip(row, padding)))
if i == 0:
print()
print()
def random_player(view, turn, state):
return random.randrange(0, 7), state
def constant_player(view, turn, state):
return 0, state
def better_random_player(view, turn, state):
while True:
j = random.randrange(0, 7)
if view[-1][j] == 0:
return j, state
def better_constant_player(view, turn, state):
for j in range(7):
if view[-1][j] == 0:
return j, state
players = [random_player, constant_player, better_random_player, better_constant_player]
run_tournament(players)
행복한 KoTHing!
임시 결과
Name Draws Losses Wins Score
zsani_bot: 40 5377 94583 0.892
better_constant_player: 0 28665 71335 0.427
constant_player: 3 53961 46036 -0.079
normalBot: 38 64903 35059 -0.298
better_random_player: 192 71447 28361 -0.431
random_player: 199 75411 24390 -0.510