단어 게임을 위해 제한된 AI 어휘를 어떻게 시뮬레이션 할 수 있습니까?


14

나는 경쟁이 치열한 소수의 단어 게임이 진행 중이며 다른 인간 상대에 대한 (대부분 비동기식) 게임을 선호하지만 플레이어에게 AI와의 게임 옵션을 제공하고 싶습니다. 사전을 가지고 있으며 AI를 재생하는 동안 AI에 사전 지식을 쉽게 제공 할 수 있지만, 내 관심사는 AI에 익숙하지 않은 단어를 정기적으로 재생하는 것은 플레이어에게 실망스러운 경험이 될 것이라는 점입니다. 방금 내가 아는 단어를 사용했다면! ' — AI의 전체 기술 수준이 낮아진 경우에도 마찬가지입니다.

차라리 조정되지 않은 놀이 매개 변수와 약한 어휘의 조합을 통해 약한 AI를 만들고 싶습니다. 그러나 어휘를 '일반적인'단어로 제한하는 방법을 잘 모르겠습니다. 여러 단어 빈도 목록 (예 : Project Gutenberg 책에 나타나는 모든 단어 목록, 발생 횟수별로 정렬)을 살펴 보았지만 모두 거짓 오탐이 있습니다. t 실제 주파수와 함께 표시됩니다 (예 : CHEETAH는 VOCATIVE 또는 SUTTEE보다 PG 텍스트에 덜 자주 표시됨). 검색 결과를 사용하여 단어의 인기도를 추정하려고했지만 허위 견적이 의심되는 경향이 있습니다. 물론 '

거친 단어 사용 빈도를 결정하는 다른 좋은 방법이나 플레이어에게 자연스럽게 느껴지는 단어 게임 AI를 제한하는 다른 방법에 대한 제안이 있습니까?


6
당신은 그것을 배울 수 있습니다! 플레이어가 단어를 사용할 때마다 "알지 못한다"는 단어를 학습 할 확률은 6/10 일 수 있습니다. 그렇지 않으면 새로운 임의의 단어를 학습합니다! (일반적으로 플레이어가 아는 단어를 배우지 만 플레이어가 모르는 단어를 천천히 가져 오는 것입니다 (교육 !!)) 물론 이것은 모든 플레이어에게 "AI 사전"이 필요하다는 것을 의미합니다.
Joel

답변:


6

나는 당신의 해결책이 여전히 단어 빈도 목록과 함께 갈 것이라고 생각합니다. 구텐베르크 프로젝트는 저작권이 만료 된 오래된 텍스트를 포함하고 있기 때문에 현대 영어 사용자에게 이상한 빈도를주기 때문에 귀하에게 적합하지 않을 수 있습니다. "음성"이 실제로 "치타"보다 일반적으로 사용되는 시간이 있었을 것 같습니다 ...

그래서 해결책은 올바른 주파수 목록 을 찾는 것 입니다. 조금만 검색하면 모든 심슨 에피소드에서 가장 많이 사용되는 5000 개의 단어가 걸림돌이되었습니다. 예를 들어 "krabappel"과 같은 단어를 정렬하기 위해 실제 사전에 대해이 목록을 상호 참조 할 수 있습니다. :)

도움이되기를 바랍니다. 어떻게 솔루션을 사용하는지 듣고 싶습니다.


1
저의 강렬한 인상은 '모든 사람이 알고 있지만 아무도 사용하지 않는 단어'와 관련된 문제는 여전히 어떤 사전에서도 지속될 것이지만, 내가 할 수있는 최선일 것입니다. 물론 플레이어가 그렇지 않을 가능성이 높습니다 심지어 인공 지능이 모르는 쉬운 단어, 딱딱한 단어 만 알 수 있습니다.
Steven Stadnicki

+1 당신이 옳을 수도 있지만 왜 그렇습니까? 일반적으로 사람들은 자주 듣는 단어를 배워야합니다. 당신이 옳다면 그 이유를 아는 것이 흥미로울 것입니다 ... :) 내 가설은 구텐베르크 프로젝트의 경우와 같이 중고 코퍼스의 편견 때문에 그 해결책을 고수한다는 것입니다. 올바른 빈도 목록 만 있으면됩니다.
Mikael Högström

5

크라우드 소싱. 플레이어가 플레이하는 모든 멀티 플레이어 게임을 사용하여 단어 빈도 표를 작성하십시오. 모든 분석 서비스가이 데이터를 수집하고 구성하는 데 도움이 될 수 있다고 생각합니다. 당신은 단어를 사용하는 플레이어가 얼마나 "좋은"가에 의해 항목에 가중치를 부여 할 수 있습니다.


나는 이것을 좋아하지만 여전히 '시작'문제보다는 '업데이트'문제를 해결하는 것처럼 느낍니다 (물론 멀티 플레이어와 솔로 게임을 나란히 시작하고 싶다고 가정합니다. 전적으로).
Steven Stadnicki

2

AI 레벨에 따라 기본 어휘부터 시작하십시오. 예를 들어 아래는 AI 레벨 목록입니다.

  • 기본 : 1000 단어 어휘
  • 평균 : 2000 단어 어휘
  • 어려운 : 5000 단어 어휘

Google 검색에서 볼 수있는 다음 웹 사이트에서이 단어를 선택할 수 있습니다 .

이 사이트는 시작 단어를 줄 것이지만 Google n-grams 가 더 나은 선택 이라고 생각 합니다. 어쨌든 AI 사전 아래에 설명 된 업데이트 / 추가 메커니즘을 사용하면 시작 단어에 대해 크게 걱정하지 않아도됩니다.

플레이어가이 게임을하는 동안 배우기 때문에 AI도 배우 야합니다. 상대방이 가장 많이 사용하는 단어를 배울 수 있습니다.

예를 들어 인공 지능 기초에 맞서 10 명을 플레이 한 경우 100 개의 알 수없는 단어, 즉 AI 사전에없는 단어를 사용했습니다. 가장 많이 사용되는 단어를 선택하여 기본 AI 사전과 평균 및 어려운 사전에 추가하십시오. 또한 사람들이 사용하는 단어로 사전에 사용되지 않는 단어를 업데이트하도록 선택해야합니다. 이런 식으로 시작 사전이 플레이어 지식에 더 적합합니다. 적은 단어로 시작하거나 다른 단어 무리로 시작할 수 있지만 AI가 인간과 대결하는 동안 배우게됩니다.

AI를 기본 수준으로 시작하고 충분한 단어를 배울 때만 다른 수준으로 업그레이드하는 것을 고려할 수 있습니다.


이것은 어휘를 업데이트하는 적절한 방법을 제공하지만 여전히 초기 질문을 남깁니다. 초기 어휘는 어디에서 왔습니까?
Steven Stadnicki
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.