“Lena”,“Mandrill”및“Cameraman”과 같은 이미지의 오디오는 무엇입니까?


21

이 이미지를 무엇이라고해야할지 모르겠지만 이미지 처리 세계에서 특정 작업의 출력을 보여주기위한 표준 예제로 자주 사용됩니다. 다음은 Lena를 "표준 테스트 이미지"로 설명하는 페이지에 대한 링크 입니다. 특정 오디오 필터 또는 작업의 효과를 보여주기 위해 유사한 표준 오디오 클립이 사용됩니까?

답변:


17

내가 생각할 수있는 가장 가까운 예 는 mpeg-1 레이어 3 개발에 사용 된 Suzanne Vega의 "Tom 's Diner" 의 시작 이며 여전히 오디오 코덱을 시연하는 데 사용됩니다.


3
yah, Tom 's Diner는 피치 감지 프로그램을 테스트하는 데 유용한 합리적으로 깨끗하고 (리버브 프리) 모노 포닉 노래 음성 스 니펫입니다. 다른 하나는 비틀즈의 "어제"(맨 오른쪽에)의 커버를 가진 Boyz II Men 클립입니다. 모노 포닉 보컬의 피치 트래킹에 좋습니다. Tom 's Diner보다 강합니다. Digital Performer가 사용한 것을 기억합니다.
robert bristow-johnson 2012

16

오디오 프로세싱은 큰 분야이지만, 특히 스피치 프로세싱에서는 하버드 문장 (Harvard Sentences )으로 알려진 샘플 데이터베이스 가 널리 사용됩니다. 하버드 문장은 미국 영어로 발음이 균형 잡힌 문장 모음입니다. 다른 언어에 대해서도 동등한 데이터베이스가 많이 있습니다.

Harvard Sentences 음성이 포함 된 실제 파일은 여기 에서 찾을 수 있습니다 .


5

또한 NIST 데이터베이스는 음성 인식 작업과 관련하여 매우 인기가 있다고 생각합니다. 실제로 매년 과제를 해결하는 동안 새로운 알고리즘과 기술을 비교하기위한 표준입니다.

또한 GFHandel-Hallelujah의load handel 스 니펫을 포함하는 MATLAB 은 꽤 일반적으로 사용됩니다.



2

0dBFS에서 1kHz 사인파의 전력을 과소 평가하지 마십시오. 모노로. 신호 경로에 잘못된 것들이 많이 있습니다.

나는 1 kHz를 정확하게 휘파람 할 수있는 충분한 오디오 시스템을 구축하고 교정했다. 간단한 기억에서.

그 외에, Donald Fagen의 IGY는 많은 축제에서 금지 된 테스트 트랙으로 유명합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.