1 |
1
중앙처리장치(3), 프로그램 메모리(2), 아날로그/디지탈 변환수단(1), 직접 영역 메모리(4)를 구비하는 하드웨어에 적용되는 음성신호의 실시간 음성부 검출 방법에 있어서, 입력음성신호를 디지탈신호로 변환하고, 일정한 길이의 프레임 단위로 변환한 후 음성부 검출에 필요한 소정의 임계치를 설정하는 제1단계(101 내지 109), 상기 제1단계에서 변환한 프레임 중 검출 대상 프레임의 평균에너지 및 영교차율을 계산하고, 상기 프레임이 시작점에 속하는지의 여부에 따른 에너지 문턱 임계치를 설정하는 제2단계(110 내지 114), 상기 제2단계 수행 후, 상기 계산된 평균에너지 및 영교차율과 상기 초기에 설정된 소정의 임계치와 비교하여 검출대상 플레임이 음성부인지 묵음부인지를 판단하는 제3단계(115), 상기 제3단계의 판단 결과, 묵음부로 판단되면 상기 제1단계로 리턴하고, 음성부로 판단되면 프레임을 메모리에 저장한 후, 음성부의 시작점이 검출되었는지 판단하는 제4단계(116 내지 118), 상기 제4단계의 판단결과, 시작점이 검출되지 않았으면, 시작점의 조건을 만족하는 경우에 시작점이 검출되었음을 나타낸 후 제1단계로 리턴하고, 시작점이 검출되었으면 끝점의 조건을 만족하는 경우에 종료하는 제5단계(119 내지 121)를 포함하는 것을 특징으로 하는 음성신호의 실시간 음성부 검출 방법
|
3 |
3
제1항에 있어서, 상기 제1단계에서 설정하는 소정의 임계치는, 묵음 3 프레임 내지 5 프레임 동안의 평균직류성분과, 묵음 3 프레임 내지 5 프레임 동안의 평균 에너지 문턱값과, 묵음 3 프레임 내지 5 프레임 동안의 영교차율의 문턱값인 것을 특징으로 하는 음성신호의 실시간 음성부 검출 방법
|