데스크탑 환경에 대한 음성 제어


16

구두 명령 GIVEN에 따라 사용자 음성 명령에 응답하고 스크립트를 실행할 수있는 시스템을 활성화하고 싶습니다.

이상적으로는 컴퓨터가 지속적으로 듣고 싶습니다.

"컴퓨터"라는 버즈 단어가 들리면 10 초 정도 명령이 활성화되고 들립니다.

활성화 된 상태에서 듣고있는 동안 다른 버즈 단어가 스크립트를 실행할 수 있기를 바랍니다.

예를 들어 ...

(컴퓨터가 유휴 상태 임) "컴퓨터"(컴퓨터가 즉시 청취) "새 메시지 액세스"(메시지가 유행어 * IGNORES "ACCESS NEW"-컴퓨터가 스크립트를 실행하고 진화 또는 공감을 엽니 다). 하나는 브라우저를위한 것이고, 하나는 창을 닫고 데스크탑을 보여주는 것, 또는 실제로 많은 것들 일 수 있습니다.

이것도 가능합니까?

답변:


7

그놈 음성 제어

Google Summer of Code 2007의 일부로 개발 된이 아이디어는 Gnome Desktop의 유용성을 향상시키는 몇 가지 기능을 개발하는 아이디어였습니다.

목표는 데스크톱 음성 제어 시스템을 구현하는 것입니다. 이 시스템은 오디오 입력 (마이크)을 모니터링하는 응용 프로그램으로 구성되며 중요한 오디오 신호가 감지되면 소프트웨어가 신호를 포착, 처리 및 인식 한 다음 Gnome Desktop에서 원하는 작업을 실행합니다. 일련의 동작에서 활성 창을 최대화, 최소화, 닫는 단계; 특정 프로그램을 엽니 다; 한 데스크탑에서 다른 데스크탑으로 전환; 무엇보다도. GnomeVoiceControl은 음성을 텍스트로 변환하기 위해 생성 된 오픈 소스 도구 인 CMU Sphinx와 함께 C로 구현됩니다.

작가의 슬라이드 쇼

안타깝게도 기본적인 "목표"를 넘어서는 발전은 없었지만 올해 불가리아와 터키어와 같은 새로운 언어에 대한 지원을 추가하는 활동이있는 것으로 보입니다.

설치하기 위해서:

sudo apt-get install gnome-voice-control

오리너구리

흥미로운 프로젝트 호출 오리너구리가 있습니다 -기본적으로 와인에서 실행되는 Dragon Naturally Speaking의 Linux 프론트 엔드입니다.

이 응용 프로그램의 명성은 "시작 터미널"과 같은 Windows 또는 Linux 프로그램 및 스크립트를 시작할 수도 있습니다.

VEDICS

이것은 Unity 인터페이스와 함께 작동한다고 말하는 새로운 프로젝트 입니다.

프로젝트 페이지는 "[프로그램 이름] 실행"을 인식하므로 이론적으로 [프로그램 이름]은 실행하려는 스크립트 일 수 있습니다.


매우 빠른 응답에 감사드립니다. 나는 그 프로그램에 대해 들었고 그것을 설치했지만, 구성을 지나치지 않는 것 같습니다-그냥 "config"라고 말합니다. 나는이 일에 많은 일을하지 않은 것에 놀랐다. 와인과 함께 사용할 수있는 창문이 있을까요?
BorgDomination

1
시냅스에있는 그놈 음성의 이전 버전은 나에게 동일한 결과를 주었다. 나는 웹 사이트에서 최신을 시도했지만 더 나아지는 것처럼 보였지만 제대로 작동하지는 않았습니다. 수동 종속성은 고통 스러웠습니다.
Kendrick

3

사이먼은 듣는다

이 프로그램은 처음에 신체 장애가있는 사람들을 위해 개발 된 음성 인식으로 마우스 및 / 또는 키보드를 대체하기위한 오픈 소스 프로젝트입니다.

응용 프로그램을 설치할 수 있는 ppa 가 있습니다 : ppa : grasch-simon-listens / simon


사이먼은 kde에서만 작동합니까? 정말 멋져 보이고 설치했지만 gnome-shell로 작동하지 않는 것 같습니다. 특히 창 관리. 예를 들어 모든 창을 표시하려면 kde env와 gnome env에서 다르게 작동합니까?
Joshua Robison

1
ppa에서 Ubuntu <= 12.04에 설치할 때 종속성 해결 해야 하지만 최근에 시도하지 않았으며 그놈 쉘이 어떻게 그놈 쉘을 방해하는지 알 수 없습니다. 12.10에는 아직 버전이 없습니다.
Takkat

3

우분투

Google2Ubuntu는 Google 음성 인식 API를 통해 음성 명령을 사용하여 컴퓨터를 제어 할 수있는 도구입니다.

터미널에서 아래 명령을 실행하여 설치하십시오 google2Ubuntu.

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

출처


1

리눅스 음성 인식

Linux 배포판에서 실행되도록 개발되고 있으며 구성 및 확장이 매우 쉽고 사용자 정의 사전, 컨텍스트 기반 인식, 받아쓰기 모드 및 구성 가능한 매크로를 지원합니다.

Linux Speech Recognition을 설치하려면 프로젝트의 GitHub 페이지 로 이동 하십시오. ZIP 파일을 다운로드하고 압축을 푸십시오.

그런 다음 몇 가지 종속성을 설치하십시오.

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

터미널에서 추출 된 폴더 (Palaver-master)를 열고 설정을 실행하십시오.

cd /~Path-to-folder~/Palaver-master/
./setup

이제 시스템 설정 ...> 키보드> 바로 가기> 사용자 정의 바로 가기로 이동하여 바로 가기를 추가하고 음성 인식의 이름을 지정하고 명령을 다음과 같이 설정하려면 바로 가기 키를 지정하여 녹음을 활성화하십시오.

/~Path-to-folder~/Palaver-master/hotkey

적용을 클릭하고 바로 가기를 클릭 한 다음 단축키를 지정하여 음성 인식을 활성화합니다.

안정적인 빌드가 아직 릴리스되지 않았으므로이 단계에서 명령이 완전히 작동 할 것으로 기대하지 마십시오. 많은 문구가 인식되지만 실제 조치는 수행되지 않습니다.



0

Snips.ai

방금 pi3에서 시도했습니다-
도커에 잠재적 인 실행 이있는 것 같습니다

https://snips.ai/


1
Ask Ubuntu에 오신 것을 환영합니다. 이 도구를 사용하는 경우 게시물에서 명시 적으로 말해야합니다. 스패머가되지 않는 방법을 참조하십시오 .
Glorfindel

1
공식 웹 사이트는 다음과 같이 말합니다 : 오픈 소스 : 우리는 시간이 지남 에 따라 Snips 를 열려고 노력하고 있으므로 Snips는 시도해 볼 가치가 있습니다.
karel
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.