특정 지점에서 매우 큰 오디오 파일을 분할하고 싶습니다. 특정 시점에서 라디오 아나운서가 와서“deux radio”와 같은 것을 말하며 항상 정확히 같은 소리를냅니다 (기록 된 클립입니다). 전체 MP3를 통해 반복되는 오디오 비트를 어떻게 찾을 수 있습니까? 그 시점에서 분할 할 수 있으면 좋을지 모르지만 시간이 흘러도 다른 프로그램으로 분할 할 수 있습니다.
특정 지점에서 매우 큰 오디오 파일을 분할하고 싶습니다. 특정 시점에서 라디오 아나운서가 와서“deux radio”와 같은 것을 말하며 항상 정확히 같은 소리를냅니다 (기록 된 클립입니다). 전체 MP3를 통해 반복되는 오디오 비트를 어떻게 찾을 수 있습니까? 그 시점에서 분할 할 수 있으면 좋을지 모르지만 시간이 흘러도 다른 프로그램으로 분할 할 수 있습니다.
답변:
이론상,이를 위해서는 자신의 앱을 작성해야합니다. 다음과 같이해야합니다.
음성 인식 엔진을 통해 WAV 파일 실행 Sphinx Speech Recognition 은 무료 오픈 소스 엔진입니다.
음성 인식 엔진이 텍스트를 실시간으로 메모리에 뱉어 내고 샘플 길이 위치를 추적하십시오. "deux radio"라는 문자열이 발견 될 때마다 샘플 위치를 splitlog.txt
파일에 뱉어 내십시오 . 이것은 실시간이므로 샘플 위치의 근사값을 얻습니다.
자신 만의 WAV 스플리터 앱 작성 : 모든 샘플 위치 포인트를 수집 splitlog.txt
하고 WAV를 적절히 분할하십시오.
당신은 시도 할 수 있습니다 :
TAPESTREA : 다음과 같이 설명되는 실험용 소프트웨어 :
TAPESTREA (또는 탭)는 복잡한 사운드를 대화식으로 분석, 변환 및 합성하기위한 통합 프레임 워크입니다. 하나 이상의 레코딩이 제공되면 다음과 같은 명확한 정의 방법을 제공합니다.
- 소리의 관심 지점을 식별하고 재사용 가능한 템플릿으로 추출
- 배경 및 / 또는 다른 이벤트와 독립적으로 사운드 구성 요소 변환
- 지속적으로 배경 질감을 지각 적으로 설득력있게 재 합성
- ChucK 오디오 프로그래밍 언어로 작성된 새로운 그래픽 사용자 인터페이스 및 / 또는 스크립트를 사용하여 배경 위에 이벤트 템플릿을 제어 가능하게 배치
음성 변환기 : 쉐어웨어 ($ 29.95, 시간 제한이없는 평가판)는 다음과 같은 도구로 설명됩니다.
피치 에디터, 포먼트 쉬프트, 비브라토, 래피 니스, 숨, 피치 범위 스케일링, 피치 스무딩, 타임 스트레치…
그 목적으로 대담 을 시도 할 수 있습니다 . 대담은 정적, 히스, 윙윙 거리는 소리 또는 기타 일정한 배경 소음을 제거 할 수 있습니다. 트랙 내에서 잘라 내기, 복사, 붙여 넣기 및 삭제를 쉽게 할 수도 있습니다. 자세한 내용은 전체 기능 목록을 확인하십시오 .
Mehper가 말한 것처럼 Audacity 를 사용할 수 있어야합니다 . 이를 위해 제거 할 오디오를 선택하고 "노이즈 프로파일"(효과 영역의 노이즈 제거 옵션에서 수행)을 생성 한 다음 전체 트랙을 선택하고 "노이즈 제거"기능을 사용할 수 있습니다.