'유진 고스트 만'은 실제로 튜링 테스트를 통과 했습니까?


18

13 살 소년을 시뮬레이트하기 위해 개발 된 컴퓨터 프로그램 인 '유진 고스트 만 (Eugene Goostman)'은 판사 중 33 %가 인간임을 판결하여 튜링 테스트를 통과했다고 밝혔다.

챗봇이라고도하는 컴퓨터 프로그램은 영어가 제 2의 언어 인 13 세의 우크라이나 소년 인 것으로 보였습니다.

저에게 유진은 평범한 챗봇처럼 반복적이고, 무의미하며, 비 조작자에게 흩어진 소리처럼 들립니다. 나는 그것이 비전문가처럼 판사들을 어떻게 확신 시켰는지 모른다.

많은 사람들이 스테반 하르 나드 교수와 같이 유진을 비난했습니다. "이건 말도 안 돼요"그리고 "우리는 튜링 테스트를 통과하지 못했습니다.

의견이 다르지만 공식적으로 테스트를 통과했는지 알고 싶습니다.

또한 다음과 같이 말하고 있습니다.

한번도 수여되지 않은 두 번의 일회성 상품. 25K는 판사가 실제 사람과 구별 할 수없고 판사가 사람이 컴퓨터 프로그램임을 확신시킬 수있는 최초의 채터 봇에 제공됩니다. $ 100,000는 판사들이 텍스트, 시각 및 청각 입력에 대한 해독 및 이해를 포함하는 Turing 테스트에서 실제 인간과 구별 할 수없는 최초의 채터 봇에 대한 보상입니다. 이것이 달성되면, 연례 경쟁은 끝날 것입니다.

유진이 25,000 달러를 mean다는 의미입니까?


2
판사들이 상황에 처해 있음을 아는 것이 매우 중요합니다.
Thorbjørn Ravn Andersen 11:24에

3
심사 위원 중 2/3는이 로봇이 인간이 아니라고 생각했다. 저에게이 상호 작용의 인공적인 성질은 대다수의 판사들에게 명백했습니다. 나는 이것을 명백한 실패라고 부를 것이다. (그리고 심지어 "유진" "원"만약 - 어떻게 인공 사람 수집 실제 현금으로 비트 코인 :-)합니까?
밥 자비스 - 분석 재개 모니카

샘플 대화를 제공 할 수 있습니까? 나는 매일 우크라이나어와 대화하고 그들이 영어를 말하는 방식을 쉽게 알아볼 수 있습니다.
Stephan Bijzitter

답변:


18

"공식 튜링 테스트"는 없으므로 "공식적으로 테스트를 통과"한다는 개념은 없습니다. Turing은 인공 지능을 평가하는 데 사용할 수있는 방법론을 설명했습니다. Eugene Goostman이 우승 한 행사 주최자는 그 방법론을 특정 방식으로 구현했으며 프로그램은 주최자가 선택한 기준을 충족했습니다. 그런 의미에서 테스트를 통과했습니다.

"공식 튜링 테스트"가 없기 때문에 Eugene Goostman 튜링 테스트를 통과하거나 심지어 튜링 스타일 테스트를 통과했다고 말하는 것이 더 적절할 수 있습니다 . 그것은 미디어가 특히 튜링의 명성과 "의 아이디어 제공 등 미묘에 데리러 것 같지도 공공 양심의 튜링 테스트".


3
하는 외에, 유진 Goostman는 ;-) 튜링의 원래 모방 게임에서 쓰레기 것
스티브 Jessop

9

당신이 언급 한상은 Loebner 상 이라고 생각합니다 . Wikipedia 페이지 (이전 링크 참조)에 따르면 2014 년의 우승자는 Bruce Wilcox의 'Rose'입니다. 이 프로그램은 일회성 상 중 하나는 얻지 못했지만 상금으로 $ 4,000를 받았습니다. 2005 년과 2008 년에는 '유진 고스트 만'이 2 위를 차지했습니다.

앨런 튜링이 통과 한 지 60 년이 지났을 때 코벤트리 대학교의 케빈 워윅 (Kevin Warwick)이 '유진 구스만 (Eugene Goostman)'대회에서 우승했습니다. 나는 상금을 모른다.

확인 레이 커즈와일의 포획을 경쟁 문제의 프로그램 모두에서. 발췌 :

워릭 교수는이 시험이“무제한”이라고 주장했다. 그러나 챗봇이 13 살짜리 아이이고 영어가 모국어가 아닌 아이라고 주장하는 것은 사실상 제한적이다. 또한, 상호 작용은 각각 5 분으로 제한되었다. 이러한 짧은 기간 동안 순진한 판사를 속일 가능성이 높습니다.

나는 챗봇 Eugene Goostman과 대화를 나 and 고 감동을받지 못했습니다. 유진은 대화를 추적하지 않고, 단어마다 단어를 반복하며, 종종 전형적인 챗봇이 아닌 무속 자에게 반응합니다.

또한 이것은 좋은 해설 인 것을 발견했습니다 : 유선-컴퓨터가 실제로 튜링 테스트에서 F를 얻었습니다.


1
특히 Wired 비트가 마음에 들었습니다. 특히 1991 년 경쟁에서 PC 치료 전문가라는 봇은 10 명 중 5 명에게 사람이라고 믿게 할 수있었습니다. 또한 "특별한"> 30 % 바보 임계 값과 관련하여 : "따라서 튜링 테스트의 아버지는 이것을 지능의 임계 값으로 사용하지 않았으며, 미래에 컴퓨터가 50 년이 될 것으로 예상되는 위치에 대한 예측 만 언급했습니다. "
Fizz

10
요약 : 유진 봇은 인간 지능을 시뮬레이션하는 것이 아니라 인간의 어리 석음을 시뮬레이션함으로써이 테스트를 "통과했습니다".
duskwuff

2

"오리지널" 튜링 테스트 에 대한 심도있는 Wikipedia 링크 추가 "튜링 테스트"라는 많은 테스트가 있습니다. Wikipedia에는 ​​"최소 3 가지 기본 버전"이 언급되어 있습니다. Eugeene이 통과 한 테스트는 3 가지 중 하나가 아닙니다. Eugeene이 통과 한 테스트는 Alan Turing이 고안 한 것이 아니라 Alan Turing에서 영감을받은 Turing 테스트라는 테스트였으며, Eugeene이 통과했습니다.

튜링 테스트의 기본 버전을 3 가지 이상 언급 한 부분 :

Saul Traiger는 튜링 테스트의 기본 버전이 3 개 이상 있으며이 중 2 개는 "컴퓨팅 기계 및 인텔리전스"에서 제공되고 1 개는 "표준 해석"이라고 설명합니다. "표준 해석"이 Turing에 의해 묘사 된 것인지 아니면 대신에 그의 논문을 잘못 읽은 것에 근거하여 논란이 있지만,이 세 가지 버전은 동등한 것으로 간주되지 않으며 그들의 강점과 약점이 구별됩니다.

버전 1

튜링의 오리지널 게임은 3 명의 플레이어가 참여하는 간단한 파티 게임을 묘사했습니다. 플레이어 A는 남자이고 플레이어 B는 여자이며 플레이어 C (심문 관 역할을하는 플레이어)는 둘 다 성입니다. 모방 게임에서 플레이어 C는 플레이어 A 또는 플레이어 B를 볼 수 없으며 서면 메모를 통해서만 커뮤니케이션 할 수 있습니다. 플레이어 A와 플레이어 B에게 질문을함으로써 플레이어 C는 두 사람 중 어느 것이 남자이고 어느 것이 여자인지를 결정하려고합니다. 플레이어 A의 역할은 질문자를 속여서 잘못된 결정을 내 리도록하는 반면, 플레이어 B는 질문자가 올바른 결정을 내릴 수 있도록 도와줍니다.

버전 2

두 번째 버전은 나중에 Turing의 1950 년 논문에 실 렸습니다. 원래 모방 게임 테스트와 유사하게, 플레이어 A의 역할은 컴퓨터에 의해 수행됩니다. 그러나 플레이어 B의 역할은 여자가 아닌 남자에 의해 수행됩니다. [...]이 버전에서 플레이어 A (컴퓨터)와 플레이어 B는 모두 질문자를 잘못 결정하도록 속이려고합니다.

버전 3

튜링 테스트의 목적은 컴퓨터가 질문자를 컴퓨터를 인간이라고 믿도록 속이는 것이 아니라 컴퓨터가 인간을 모방 할 수 있는지 여부를 구체적으로 판단하는 것입니다. 이 해석이 Turing에 의해 의도 된 것인지에 대한 논쟁이 있지만 Sterrett은 이것이 두 번째 버전을이 버전과 겹치게한다고 믿고 있지만 Traiger와 같은 다른 버전은 그렇지 않습니다. 그럼에도 불구하고 "" 표준 해석. " 이 버전에서 플레이어 A는 컴퓨터이고 플레이어 B는 섹스를하는 사람입니다. 심문의 역할은 남성과 여성을 결정하는 것이 아니라 컴퓨터와 인간을 결정하는 것입니다. 표준 해석의 근본적인 문제는 질문자가 어떤 응답자가 인간이고 어떤 응답자가 기계인지 구별 할 수 없다는 것입니다. 기간에 대한 문제가 있지만 표준 해석에서는 일반적으로이 제한을 합리적인 것으로 간주합니다.

대조적으로, Eugeene이 통과 한 테스트는 인간 판사들이 5 분 동안 챗봇과 채팅을 한 후 봇인지 아닌지를 결정해야했습니다.


당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.