다른 사람의 음성을 샘플링하여 다른 음성을 변조하거나 텍스트를 합성하여 원래 음성과 유사한 기존 응용 프로그램이 있습니까?
예를 들어, AT & T 의이 Text-to-Speech Demo를 사용하면 샘플링 된 일부 사람의 음성을 기반으로하는 사전 설정에서 음성과 언어를 선택할 수 있습니다.
이 과정을 어떻게 부릅니까? 음성 변조입니까? 음성 합성?
다른 사람의 음성을 샘플링하여 다른 음성을 변조하거나 텍스트를 합성하여 원래 음성과 유사한 기존 응용 프로그램이 있습니까?
예를 들어, AT & T 의이 Text-to-Speech Demo를 사용하면 샘플링 된 일부 사람의 음성을 기반으로하는 사전 설정에서 음성과 언어를 선택할 수 있습니다.
이 과정을 어떻게 부릅니까? 음성 변조입니까? 음성 합성?
답변:
첫 번째 참고 사항 : 연결 한 AT & T의 시스템과 같은 대부분의 최신 텍스트 음성 변환 시스템은 연결 음성 합성을 사용 합니다. 이 기술은 한 사람의 목소리를 기록하는 방대한 데이터베이스 데이터베이스를 사용하여 많은 문장 조합이 존재하도록 선택된 문장을 길게 수집합니다. 문장을 합성하는 것은이 말뭉치에서 세그먼트를 함께 묶는 것만으로도 가능합니다. 어려운 것은 문자열을 매끄럽고 표현력있게 만드는 것입니다.
이 기술을 사용하여 오바마 대통령이 당황스러운 말을하게하려면 두 가지 큰 장애물이 있습니다.
이 두 가지 문제를 해결할 예산이 있다면 이것이 가능한 해결책이라는 직관이 유효합니다.
다행히도 적은 감독과 적은 데이터로 작동 할 수있는 다른 기술이 있습니다. 녹음에서 하나의 음성을 "가짜"또는 "모방"하는 데 관심이있는 음성 합성 분야를 음성 변환이라고 합니다. 대상 스피커 A 말하기 문장 1의 녹음 A1과 소스 스피커 B 말하기 문장 2의 녹음 B2가 있으며, 가능하면 스피커 B의 녹음 B1에 액세스하여 스피커 A 말하기 문장 2의 녹음 A2를 생성하는 것을 목표로합니다. 그 / 그녀의 목소리로 목표 화자와 동일한 발화.
음성 변환 시스템의 개요는 다음과 같습니다.
나는 이것이 B2에서 음성 인식을 수행 한 다음 A1의 음성을 코퍼스로 사용하여 TTS를 수행하는 것보다 훨씬 낮은 수준에서 작동한다는 사실을 주장합니다.
1 단계와 2 단계에 다양한 통계 기법이 사용됩니다. GMM 또는 VQ가 가장 일반적입니다. 파트 2에는 다양한 정렬 알고리즘이 사용됩니다. 가장 까다로운 파트이며 A1과 B2보다 A1과 B1을 정렬하는 것이 더 쉽습니다. 더 간단한 경우에는 Dynamic Time Warping과 같은 방법을 사용하여 정렬 할 수 있습니다. 4 단계에서 가장 일반적인 변환은 특징 벡터의 선형 변환 (행렬 곱셈)입니다. 더 복잡한 변환은보다 사실적인 모방을 만들지 만 최적의 매핑을 찾기위한 회귀 문제는 해결하기가 더 복잡합니다. 마지막으로, 단계 5에서와 같이, 재 합성의 품질은 사용 된 특징에 의해 제한된다. LPC는 일반적으로 간단한 변환 방법을 처리하기가 더 쉽습니다 (신호 프레임 가져 오기-> 잔류 및 LPC 스펙트럼 추정-> 필요한 경우 피치-시프트 잔류-> 수정 된 LPC 스펙트럼을 수정 된 잔차에 적용). 시간 영역으로 되돌릴 수 있고 번영과 음소를 잘 구분할 수있는 음성 표현을 사용하는 것이 여기에 중요합니다! 마지막으로, 동일한 문장을 말하는 스피커 A와 B의 정렬 된 기록에 액세스 할 수 있다면, 하나의 단일 모델 추정 절차에서 단계 1, 2, 3 및 4를 동시에 처리하는 통계 모델이 있습니다.
나중에 참고 문헌으로 다시 돌아올 수도 있지만 문제에 대한 느낌을 얻기 시작하기에 매우 좋은 곳이며이를 해결하는 데 사용되는 전체 프레임 워크는 Stylianou, Moulines 및 Cappé의 "확률 적 분류 및 고조파를 기반으로 한 음성 변환 시스템입니다. 플러스 노이즈 모델 ".
내 지식에는 음성 변환을 수행하는 소프트웨어가 없으며 음조 및 성대 길이 매개 변수 (예 : IRCAM TRAX 변환기)와 같은 소스 음성의 속성을 수정하는 소프트웨어만이 있습니다. 대상 음색에 가까운 사운드를 녹음합니다.
당신이 찾고있는 것을 보코더라고합니다.
Audcity의 보코더를 사용해 보셨습니까? Audacity는 http://audacity.sourceforge.net/download 에서 다운로드 할 수 있습니다 . 사용 방법에 대한 데모는 https://www.youtube.com/watch?v=J_rPEmJfwNs 에서 확인할 수 있습니다 .