답변:
귀하의 질문에 대한 답변은 "원칙적으로 그렇습니다"입니다. 가장 일반적인 형태의 EQ 테스트는 Turing 테스트의 특정 사례 일뿐입니다 ( "어떻게 생각하십니까?").
의미있는 EQ 테스트를 달성하기 어려운 이유를 확인하려면 다음 두 가지 가능한 테스트를 고려하십시오.
복잡성의 극한 상황에서 영화 'Blade Runner'는 감정적으로 부과되는 질문에 대한 응답을 기반으로 인간과 안드로이드를 구별하는 테스트를 유명하게 보여줍니다.
이 질문들 (또는 훨씬 더 간단한 질문들)을 현대의 챗봇에게 물어 보았다면, 당신이 사람과 말하고 있지 않다는 결론을 빨리 내릴 것입니다.
EQ 평가의 문제점은 감정적으로 정교하게 테스트할수록 입력을 의미있는 표현으로 바꾸기 위해 AI 시스템이 더 일반적이어야한다는 것입니다.
위에서 말한 다른 극단에서, EQ 테스트가 인간에 의해 제공된 구조화 된 입력과 함께 매우 구조화 된 방식으로 표현되었다고 가정하자. 이러한 경우, 'EQ 테스트'에서의 성공은 실제로 현실에 근거하지 않습니다.
"지울 수없는 엘리자 (Eliza) 효과와 그 위험성"이라는 제목의 논문에서 Douglas Hofstadter는 다음과 같은 예를 제시합니다.
여기 컴퓨터는 그의 아내 제인과 그의 좋은 친구 벅을 술집에 데려가는 슬러그 고라는 동료에 대해 배웁니다. 그녀는 아기를 가지고 있지만 그것을 원하지 않아서 남편의 도움을 받아 아기를 강에 익사 시켜서 "밤비의"문제 "를 깔끔하게 해결했습니다.
이 이야기는 다음과 같은 형식으로 ACME에 제공됩니다.
ql: (neglectful-husband (Sluggo))
q2: (lonely-and-sex-starved-wife (Jane-Doe))
q3: (macho-ladykiller (Buck-Stag))
q4: (poor-innocent-little-fetus (Bambi))
q5: (takes-out-to-local-bar (Sluggo Jane-Doe Buck-Stag))
...
q11: (neatly-solves-the-problem-of (Jane-Doe Bambi))
q12: (cause (ql0 q11))
Jane Doe의 행동이 도덕적 이었는지 프로그램에 질문을했다고 가정하자. '부주의', '외롭고', '순진한'과 같은 복잡한 복합 감정적 개념은 단순한 술어인데, AI가 더 깊이 내성적 인 검사를 할 수는 없습니다. 'bling-blang-blong15657'과 같은 레이블로 쉽게 교체 할 수 있습니다.
어떤 의미에서 어떤 깊이의 EQ 테스트에서도 성공하지 못한다는 것은 현재 AI가 직면하고있는 일반적인 문제를 나타냅니다. 고양이의 비디오를 인식하는 것보다 복잡합니다.