아래는 말하는 사람의 녹음을 나타내는 신호입니다. 이를 바탕으로 일련의 작은 오디오 신호를 만들고 싶습니다. '중요한'사운드가 시작되고 끝나는시기를 감지하고이를 마커로 사용하여 새로운 오디오 조각을 만드는 아이디어입니다. 다시 말해, 오디오 '청크'가 시작 또는 중지 된 시점에 대한 표시로 침묵을 사용하고이를 기반으로 새로운 오디오 버퍼를 만들고 싶습니다.
예를 들어 사람이 자신의
Hi [some silence] My name is Bob [some silence] How are you?
그런 다음 이것으로부터 3 개의 오디오 클립을 만들고 싶습니다. 하나는 Hi
, 다른 My name is Bob
하나는 말합니다 How are you?
.
저의 초기 아이디어는 오디오 버퍼를 통해 진폭이 낮은 영역이 있는지 지속적으로 확인하는 것입니다. 어쩌면 처음 10 개의 샘플을 가져 와서 값을 평균화하고 결과가 낮 으면 침묵으로 표시하십시오. 다음 10 개의 샘플을 확인하여 버퍼를 진행합니다. 이 방법으로 증가하면 봉투가 시작되고 중지되는 위치를 감지 할 수 있습니다.
누군가 좋은 일에 대한 조언을 가지고 있지만 이를 수행하는 간단한 방법이 있다면 좋을 것입니다. 내 목적을 위해 솔루션 은 아주 기초 가 될 수 있습니다.
저는 DSP 전문가가 아니지만 몇 가지 기본 개념을 이해합니다. 또한 프로그래밍 방식 으로이 작업을 수행하므로 알고리즘 및 디지털 샘플에 대해 이야기하는 것이 가장 좋습니다.
모든 도움을 주셔서 감사합니다!
편집 1
지금까지 큰 반응! 이것이 라이브 오디오에 있지 않다는 것을 분명히하고 싶었고 C 또는 Objective-C로 직접 알고리즘을 작성하므로 라이브러리를 사용하는 솔루션은 실제로 옵션이 아닙니다.