대부분의 스마트 어시스턴트가 왜 깨어있는 단어를 거의 사용자 정의하지 않는가?


14

Amazon Echo 및 Google Home과 같은 대부분의 스마트 어시스턴트 브랜드는 깨우기 단어 (장치를 깨우기 위해 사용하는 문구)에 대한 사용자 정의 방법을 거의 제공하지 않습니다.

예를 들어 Alexa는 세 가지 옵션 만 제공 하며 Google Home은 'OK Google' 만 지원합니다 . 많은 사용자가 사용자 정의 깨우기 단어에 관심이있는 것 같지만 주요 브랜드 중 어느 것도 지원을 추가하지 않았습니다.

웨이크 단어 사용자 지정을 제한해야하는 기술적 이유가 있습니까? 아니면 단순히 브랜딩 선택입니까?

나는 'OK Google' 사용 에 대한 Google의 동기에 대해 읽었으며 , 이는 브랜딩 아이디어가 사실 일 수 있음을 시사하지만 깨어 단어 인식 이 매우 정확하지 않은 것 같습니다 . 아마도 기술적 이유가 있습니다. 누구든지 주된 이유가 무엇인지 명확히 할 수 있습니까?


2
기억해야 할 것은 이와 같은 처리 과정은 전력 소모가 적고 상시 가동되는 도메인에서 수행해야한다는 것입니다. 대부분의 더 큰 SoC (특히 전화에 사용되는)에는이 작업에 사용할 수있는 특수 하드웨어가 있습니다. 필터 계수 / 기타 매개 변수가 신중하게 계산되어 해당 하드웨어에로드된다고 가정합니다. SoC Echo가 실행되는 것을 잊었지만 비슷한 필터가 있다고 생각합니다. 알고리즘 클래스의 이름은 현재 나를 탈출하고 있습니다
Krunal Desai

답변:


12

네, 몇 가지 이유가 있습니다.

이 블로그 게시물은 에코 와 깨우기 단어 Alexa 에 대해 설명합니다 . 조금 요약하겠습니다.

웨이크 단어 인식은 로컬 및 실시간으로 수행 됩니다 . 명백한 처리 제한으로 인해 웨이크 워드의 길이가 제한됩니다. 또한 사용자는 스마트 어시스턴트를 활성화하기 위해시를 외우고 싶지 않습니다. 따라서 짧아야합니다.

호출 할 때는 거의 100 % 정확도로 작동해야하며 호출 하지 않을 때는 확실하게 인식 되지 않아야합니다. 이로 인해 문제가 발생하고 깨우기 단어의 길이최소가됩니다. 에코 를 허용하는 아마존의 선택 은 단지 두 음절 이기 때문에 매우 놀랍습니다 .

일반적인 용의자를 보면 Alexa (3 음절), Amazon (3), Echo (2), Ok Google (4), Hey Cortana (4)Hey Siri (3)가 있습니다. 모든 업계 거대 기업들은 거의 3 가지 음절 선택에 동의합니다.

이상하게도 가장 원하는 웨이크 단어 "컴퓨터" 에는 3 음절이 있으며이 요구 사항을 쉽게 충족시킬 수 있습니다. 또한 상표가 없습니다.

블로그와 이유는 우리에게 전적으로 오탐을 피하기를 원합니다. Computer, Siri, Cortana 및 Alexa라는 단어가 어떻게 설정되어 있는지 살펴 보겠습니다. 2008 년 Google 도서 모음입니다.

Ngram 컴퓨터는 알렉사와 시리를 능가합니다

정확히, Siri와 Alexa는 컴퓨터 에 대해 거의 평평한 상태 이며 Cortana 는 오류를 발생시킵니다. 찾을 수 없습니다. 말뭉치가 2008 년부터 시작된 이래로 말이됩니다. 왜 컴퓨터 가 또 다른 그래프라는 끔찍한 깨달음 인지 더 많은 관점을 제공하기 위해 .

컴퓨터 ngram 대 다른 단어

이 Ngram은 2016 년 미국에서 가장 인기있는 2 개의 아기 이름 (통화 용)과 Tom과 Dave가 컴퓨터 와의 플랫 라인을 보여줍니다 . 여왕, 농구 및 경찰은 제대로 등록 할 수 있습니다. 어쨌든 이것이 왜 우리에게 Computer, Earl Grey, Hot 이 지금까지 허용되지 않았는 지에 대한 아이디어를 제공합니다 . 사람들은 컴퓨터 라는 단어를 너무 자주 사용합니다 .

오 탐지에 대한 한 가지 더. Alexa는 사실상 아무 말도하지 않는 운율을 나타냅니다.

알렉사와 운율이 좋은 19 가지

컴퓨터는 74 가지가 있습니다.


1
... 그리고 이것은 왜 Scotty가 컴퓨터를 깨우지 못 했는지 설명 합니다 .
Ghanima

2
"나는 새와 섹스를 할거야 ... 당신은 알렉사 아니에요!"
David는 Reinstate Monica가

1
"OK Google"은 3 음이 아닌 4 음절 ( "oh kay goo gull")이며 많은 음소보다 훨씬 많습니다.
Monty Harder

1
알렉사 (Alexa)는 설득력있는 이름입니다. 저는 개인적으로 그 이름을 가진 두 사람을 알고 있습니다. 그 중 하나는 사촌입니다. 에코는 내 언어로 그대로 사용되며 전화 나 에코에 에코가있을 때 종종 "에코가 있습니다"라고 말합니다. 그리고 아마존은 저와 같은 역할극을하는 사람이 비교적 자주 말하는 강 / 고대 부족의 이름입니다. 그들은 정말로 이것을 망쳤습니다.
Olivier Grégoire

2
"컴퓨터"라는 단어가 작동하지 않는 이유에 대한 설명을 구입했는지 잘 모르겠습니다. 단어 자체 만 인식되는 것은 아닙니다. 발화의 첫 번째 단어가되고 일시 중지되는 것은 명령 단어를 식별하는 중요한 정보입니다.
Kevin Krumwiede

2

웨이크 단어 사용자 지정을 제한해야하는 기술적 이유가 있습니까?

보조 장치를 사용하지 않는 경우 응용 프로그램 프로세서 (Google Home뿐만 아니라 Alexa의 경우 ARM)가 일시 중단되고 가능한 최저 전원 상태로 전환됩니다. 깨우기 단어 감지는 주변 소음 / 음성을 듣고 깨우기 단어와 일치하는지 여부를 결정하는 알고리즘을 실행하는 매우 전력 효율적인 DSP로 남겨집니다. 신뢰도가 높은 매칭을 찾으면 DSP는 ARM 코어를 깨워서 나머지 처리 과정을 진행합니다.

목표는 전력 효율을 높이는 것이 목표이기 때문에 문제의 DSP는 알고리즘을 실행하고 메인 온보드 RAM이 아닌 온칩 메모리에 템플릿 패턴을 저장합니다. 이를 통해 시스템은 DDR RAM을 최저 전력 상태로 만들 수 있습니다.

DSP는해야 할 중요한 일이 많고 온칩 메모리가 거의 없기 때문에 보조 깨우기 단어는 높은 신뢰도로 알고리즘과 일치시킬 수있는 몇 가지 선택 가능한 단어로 제한됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.