튜링 테스트 또는 그 변형은 인공 지능에 대한 신뢰할 수있는 테스트입니까?


34

튜링 테스트 ( Turing Test) 는 인공 지능의 첫 번째 테스트였으며 이제 약간 구식입니다. 총 튜링 테스트는 훨씬 더 정교한 시스템을 필요로하는보다 현대적인 테스트가되는 것을 목표로하고있다. 인공 지능 (약한 AI)과 인공 일반 지능 (강한 AI) 을 식별하기 위해 어떤 기술을 사용할 수 있습니까?


6
많은 참가자들과의 통계적 접근이 반드시 필요합니다. 튜링 테스트를 통과하지 못한 일부 사람들을 만났습니다.
SF.

1
그것은 당신이 지능을 정의하는 것에 달려 있습니다.
baranskistad

답변:


15

튜링 테스트의 수사 점은 '인간'에 대한 '테스트'를 내부 구성 요소가 아닌 관찰 가능한 결과 에 배치한다는 것입니다 . AI와 상호 작용할 때 사람과 똑같이 행동한다면, 어떻게 AI 와의 차이점 알 수 있습니까?

그러나 지능에는 많은 구성 요소가 있으며 많은 종류의 지적 작업이 있기 때문에 신뢰할 만하다는 의미는 아닙니다. 튜링 테스트 (Turing Test)는 어떤면에서 사람들의 행동에 대한 반응에 관한 것인데, 이는 전혀 신뢰할 수없는 일입니다. 많은 사람들 이 매우 단순한 챗봇 인 ELIZA 가 훌륭한 청취자 라고 생각 하고 매우 감정적으로 매우 빠르게 감정적으로 관여 했다는 것을 기억하십시오 . 이케아 광고는 램프를 버리는 것에 대해 생각합니다 . 램프가 아닌 사람의 시청자 (그리고 음악) 로부터 감정적 인 애착이 생깁니다.

특정 경제 활동에 대한 튜링 테스트는 훨씬 더 실용적입니다. 예를 들어, Uber 드라이버를 대체하는 AI를 작성할 수 있다면 누군가 대화 형 챗봇을 만들 수있는 것보다 훨씬 더 명확합니다.


10

튜링 테스트의 문제점은 인간과 유사한 기계 능력을 테스트한다는 것입니다. 모든 형태의 AI가 반드시 인간과 닮아야하는 것은 아닙니다. 이로 인해 튜링 테스트의 신뢰성이 떨어집니다. 그러나 실제 테스트이므로 여전히 유용합니다. 또한 튜링 테스트를 통과하거나 가장 가까운 Loebner Prize 를 통과 한 것에 대한 상이 있다는 점도 주목할 만합니다 .

지능에 대한 지능형 에이전트 정의는 에이전트가 과거 경험과 지식을 기반으로 성능 측정의 예상 값을 최대화하도록 작동하는 경우 지능적이라고 말합니다. ( Wikipedia 에서 그린 ). 이 정의는 더 자주 사용되며 인간을 닮는 능력에 의존하지 않습니다. 그러나 이것을 테스트하기가 더 어렵습니다.


7

고전적인 튜링 테스트에는 확실히 한계가 있습니다. 여기에 아직 언급되어 있지 않기 때문에 튜링 테스트가 실제로 '의식'을 확인하지 못하는 가장 일반적으로 인용되는 이유 중 하나 인 차이니즈 룸 에 대해 읽어 보시기 바랍니다 . 그러나 튜링 테스트를 제안한 최초의 논문에서 튜링 자신은 테스트 가 의식을 감지하는 테스트가 아니라는 점을 분명히 인정했다는 점에 주목합니다 .

나는 "기계가 생각할 수 있는가?"라는 질문을 고려할 것을 제안합니다. 이것은 "기계"와 "생각"이라는 용어의 의미에 대한 정의로 시작해야합니다. 정의는 가능한 한 단어의 정상적인 사용을 반영하도록 구성 될 수 있지만, 이러한 용어는 "기계"와 "생각"이라는 단어의 의미가 일반적으로 사용되는 방법을 조사하여 발견되는 경우 위험합니다. "기계가 생각할 수 있는가?" Gallup 설문 조사와 같은 통계 설문 조사에 참여해야합니다. 그러나 이것은 터무니없는 것입니다. 그러한 정의를 시도하는 대신, 나는 그 질문을 다른 질문으로 대체 할 것이다. 이것은 다른 질문과 밀접한 관련이 있으며 비교적 모호하지 않은 단어로 표현된다.

문제의 새로운 형태는 우리가 '모방 게임'이라고 부르는 게임의 관점에서 설명 할 수 있습니다.

이 모방 게임은 오늘날 우리가 알고있는 테스트입니다 (또한 베네딕트 컴버 배치와 키이라 나이틀리가 주연 한 최근 장편 영화의 이름에 대한 영감을 얻었습니다).


1
좋은 대답입니다. 또한 "모방 게임"에서 "투어 테스트"로의 전환으로 인해 파급 효과에 대한 깊은 오해가 생겼습니다. (포르노 봇은 항상 튜링 테스트를 통과합니다.)
DukeZhou

5

야생에는 인공 지능에 대한 많은 정의가 있습니다. 이 모든 정의는 하나 이상의 영역에 속합니다. 네 가지 주요 도메인이 있으며 아래 그림은 이에 대해 약간의 조명을 제공합니다.

여기에 이미지 설명을 입력하십시오



튜링 테스트는 카디널리티의 왼쪽을 중심으로 진행되며, 주로 카디널리티가 인간의 생각이나 행동과 관련이 있습니다. 그러나 우리는 이것이 전부가 아니라는 것을 알고 있습니다. 튜링 테스트 (Turing Test)는 AI가 일반적인 의미로 제공 할 때 제공하지 않습니다.
위키 백과에서 알 수 있듯이 튜링 테스트는 인간과 동일하거나 구별 할 수없는 행동을 보이는 기계를 테스트하기 위해 만들어졌습니다. 인공 지능은 인간이 할 수있는 일이나 행동 방식보다 훨씬 더 중요합니다. 비 지능적이고 때로는 비인간적 인 것으로 간주되는 많은 인간의 행동이 있습니다.
차이니즈 룸 인수"의식 대 의식의 시뮬레이션"과 관련하여 매우 중요한 것에 중점을 둡니다.. 존 시일 (John Searle)은 기계 (또는 인간)가 생각이나 마음을 가지지 않고 과제를 완수하기 위해 수많은 미리 정의 된 규칙 (알고리즘)을 따르는 것이 가능하다고 주장했다. 약한 AI는 이해하는 능력을 시뮬레이션하는 데 능숙하지만 실제로 무엇을하고 있는지 이해하지는 못합니다. 그들은 "자기 인식" 을 나타내지 않으며 자신에 대한 표현을 형성하지 않습니다. "나는 내가 원하는 것을 알고 싶다" 는 두 가지 다른 것이다.

Mind of Mind는 좋은 AI는 자신이 작업하는 세계뿐만 아니라 세계의 다른 요원과 단체에 대해서도 대표성을 형성해야한다고 말합니다. 이 두 가지 자기 인식 개념 과 마음 이론은 약한 AI와 강한 AI 사이에 얇은 선을 그립니다.

튜링 테스트의 경우 여러 가지 이유로 실패하며 전체 튜링 테스트도 마찬가지로 테스트에 다른 레이어를 추가합니다. 대부분의 연구원들은 Turing Test가 주요 목표에서 산만 해져 유익한 작업을 방해한다고 생각합니다. 이것을 고려하고 인간과 기계를 구별하기 위해 어려운 산술 문제를 요구한다고 가정하십시오. 기계가 인간 인 척하고 싶다면 거짓말을해야합니다. 이것은 우리가 원하는 것이 아닙니다. 튜링 테스트를 진행하면 상한을 AI로 만들 수 있습니다. 또한 AI를 인간처럼 행동시키고 인간처럼 행동하는 것은 좋은 생각이 아닙니다. 인간은 항상 올바른 결정을 내리지 못합니다. 이것이 우리가 역사 책에서 전쟁에 대해 읽은 이유입니다. 우리가 내리는 결정은 종종 편견, 이기적인 기원 등을 갖습니다.

AI를 테스트하는 테스트가 하나도 없다고 생각합니다. AI에는 많은 정의와 유형이 있기 때문입니다. AI가 약하거나 강한 지 여부는 "나는 내가 원하는 것을 알고 싶다", "누구나 내가 정확히 무엇을하고 있는지 (기계의 관점에서)"와 같은 질문에 대한 답변을 찾는 동안 태그를 붙일 수 있습니다. 위에서 언급 한 다른 질문들.


3

시험을받는 방법에 따라 다릅니다. 예를 들어 사람들이 몇 년 전에 기계가 튜링 테스트를 성공적으로 통과했다고 주장했을 때 기준은 매우 약했습니다. 5 분 동안 사람들의 30 % 만 속이는 것이 었습니다. 그것은별로 테스트가 아닙니다. 이것을 관점에서 살펴보면 정신 분열증, 자폐증, 학습 장애 또는 치매를이 기준으로 감지하지 못할 수 있습니다.

과대 광고에도 불구하고, 현재 AI는 상당히 간단한 질문으로 100 % 감지 될 수 있습니다.


좋은 지적. "질문에 ... 충분한 수의 주어" (물론,에 보이트 - Kampff 시험 문제의 제한된 수의 매우 효과적인 것 같습니다)
DukeZhou

2

튜링 테스트 또는 그 변형은 인공 지능에 대한 신뢰할 수있는 테스트입니까?

근시

예, Alan Turing의 모방 게임 또는 그 변형 중 하나에서 인공 지능이라는 용어를 정의하는 경우 가능합니다. AI가 등장하기 전에 사람들이 그 단어를 해석함에 따라 지능의 정의로서의 접근은 동시에 유효하고 매우 제한적일 수있다.

입증 된 지능

결과적으로 인공 지능 또는 다른 방식으로 지능을 측정하기위한 많은 대체 접근법이 있습니다.

  • 체스 그랜드 마스터되기
  • 수상 경력이있는 체스 프로그램 작성
  • 매우 선택적인 국제 상 수상
  • 전쟁이나 평화를이기는 전략 만들기
  • 대통령이되기 위해 사업이나 정치에서 수천 번의 제거를 극복하다
  • 인간의 패러다임 변화를 유발하는 훌륭한 기사, 논문, 시나리오, 강의, 연설, 서적 또는시 제작
  • Mensa 테스트에서 천재 수준의 결과 표시
  • 세계에서 가장 부유 한 사람 중 하나가 됨

정상 지능의 정상 측정

그러나 이것은 어떤 종류의 예외적 인 지능의 측정치입니다. 주로이 분야의 지도자들이 여러 실제 시나리오를 통해 현저한 성공을 가져 오는 방식으로 여러 도메인에 지능을 안정적으로 적용했기 때문입니다. 신뢰성은 지능 자체를 테스트하는 것이 아니라 지능을 소유 한 사람의 속성입니다.

이것들은 더 평범하지만 더 유효하고 신뢰할 수있는 지능의 척도입니다.

  • 가족 및 가족 구성원의 면밀한 인터뷰를 통해 건강하고 사랑스러운 어린이를 검증 할 수있게 함
  • 여러 유형의 다양한 조건에 대한 반복적이고 성공적인 치료법은 한 번 유형적이고 측정 가능한 방식으로 파손 된 것으로 확인되었으며 지능 이해, 분석 및 치료 조치를 적용한 결과 측정 가능한 것으로 확인되었습니다.
  • 대화 참가자가 대화를 통해 설정 한 아이디어와 사례에 자신의 성공을 기여하는 대화 참가자를 통해 측정 가능한 대화 지능

진정으로 원하는 최종 목표는 무엇입니까?

튜링 테스트의 주요 특징은 인공적인 것입니다. 인공 지능이 AI 소프트웨어에서 원하는 것이라면 우리가 받게 될 것입니다. 그러나 우리는 훨씬 더 많거나 더 적은 것을 원할 것입니다.

우리는 일부 컴퓨터가 우리의 친구, 멘토, 그리고 탁월한 능력을 가진 무급 직원이 될 수 있다는 점에서 더 많은 것을 원합니다. 소득, 영향력, 인기 또는 유산 측면에서 우리의 개인적인 성공을 이끌어냅니다.

우리는 일부 컴퓨터가 도메인 특정 작업을 수행하고 우주선이나 우리가 인간의 이름을 부여하는 다른 복잡한 장치와 같이 약간의 개성과 따뜻함을 가진 완전한 보조 도구로 남아 있기를 원하지만 멀리 도달하는 기능을 예측할 수는 없습니다. 인간의 지능.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.