음성 (mp3 오디오 파일)을 텍스트로 변환


8

mp3에서 txt로 변환하는 간단한 변환기를 찾고 있습니다. 나는 성공하지 않고 시도했습니다 : 줄리어스, CMU 스핑크스 ... 지난 4 시간 동안 나는 그것들을 사용하는 방법 (또는 올바르게 설치하는 방법)을 찾지 못했습니다.

내가 찾고있는 것은 다음과 같습니다.

$ converterapp -infile myspeech.mp3 -outfile myspeech.txt

변환 할 파일이 적고 클릭 할 수 있기 때문에 GUI 응용 프로그램에도 좋습니다.

편집 :이 답변의 도움으로 MP3를 텍스트로 변환하는 음성 인식 응용 프로그램? 나는 그것을 작동 시키려고했지만 출력을 얻지 못했습니다. 글쎄, 실제로 몇 줄의 빈 줄이 생성됩니다 (단어가 감지되지 않음) ...


정확한 명령과 출력 결과는 무엇입니까?
Nikolay Shmyrev

1
$ pocketsphinx_continuous -infile 1.wav -hmm en-us / cmusphinx-en-us-5.2 -lm en-us / en-70k-0.2.lm -logfn / dev / null &> otput.txt는 정확한 명령입니다 @NikolayShmyrev 질문입니다. sourceforge.net/projects/cmusphinx/files/… 에서 모델을 다운로드했습니다 .
Samo

답변:


4

pocketsphinx는 기존 오디오 파일에서 텍스트 음성 변환을 수행합니다. mp3의 초기 형식에 따라 두 개의 별도 명령이 필요할 수 있습니다.

먼저 기존 오디오 파일을 필수 입력 형식으로 변환하십시오.

    ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

런 포켓

    pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt

작성된 파일 myspeech.txt에 원하는 내용이 있습니다.


우분투를 처음 사용하는 경우 다음 명령을 사용하여 위 프로그램을 설치해야합니다.

    sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg

0

Mozilla SpeechDeep 오픈 소스 음성-텍스트 도구가 할 것입니다. 리눅스 데스크탑에 애플리케이션을 설치해야합니다. 또는 설치가 필요없는 브라우저 기반의 음성 텍스트 도구 인 Transcribear 를 사용해 볼 수 있지만, 기록을 서버에 업로드하려면 온라인으로 연결해야합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.