CPU 성능이 거의 필요없는 음성 합성?


13

1MHz 8 비트 CPU 개인용 컴퓨터 (Apple II, Atari 800 등) 시절에는 이러한 PC에서 이해할 수있는 임의의 텍스트 음성 변환을 수행 할 수있는 소프트웨어 프로그램이있었습니다. 비슷한 성능과 메모리를 가진 마이크로 컨트롤러에서의 구현에 적합한 출판 된 음성 합성 알고리즘은 무엇입니까? (만약에 어떠한...)


어떻게했는지 모르지만 여기 에는 SpeakerJet이라는 allophone-to-audio IC가 있으며 여기 에는 관련 text-to-allophone 생성기가 있습니다. speakjet.com 의 사람들에게 그들이 어떻게했는지 물어볼 수 있습니다 .
Kevin Vermeer

@KevinVermeer-왜 이것을 답변으로 게시하지 않았습니까? 내 대답에 대한 훌륭한 보완책이 될 것이므로 적어도 나에게서 공감대를 얻었을 것입니다.
마크 부스

답변:


3

80 년대에 8 비트 가정용 컴퓨터에서 재생 한 방법에는 작은 음성 샘플 세트가 있고 샘플로 말하고 싶은 텍스트를 정의하는 것이 포함되었습니다.

당시 IPA 에 대해 몰랐기 때문에 문자 당 2 개의 사운드를 사용하고 짧은 소리를 소문자에, 긴 소리를 대문자에 할당했습니다. 이것은 꽤 많은 격차를 떠나지 않았다,하지만 / ɒ / (대한 뜨거운 ) 및 O / oʊ / (대한 개방 쉬운 있었지만, / U /합니다 () OO의 사운드 달이 ) 내 시스템에 표시되지 않을 수있는 내 이름 (/ buːð /와 / smuːð /와 함께 운율, itinerarium음소 합성 웹 페이지 에서 시도해보십시오)에서 나에게 문제가되었습니다 .

요즘에는 훨씬 더 영리한 일을 할 수 있습니다. 검색 기술을 사용하여 직교 텍스트의 알려진 단어를 알려진 발음 기호로 변환하고 알 수없는 단어의 경우 Phonics 를 알고리즘으로 구현 하면 합리적인 작업을 수행해야합니다.

음성 스트림을 얻은 후에는 DMA 기술을 사용 하여 CPU에 대한 오버 헤드를 줄이면서 메모리에서 DAC로 개별 음소 샘플 을 스트리밍 할 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.