1 |
1
음성 구간을 검출하는 방법에 있어서,잡음 환경에서 수신된 음성 신호를 복수의 프레임들로 분할하는 단계;상기 복수의 프레임들로 분할된 상기 음성 신호를 주파수 영역으로 변환하는 단계;상기 복수의 프레임들 중 특정 개수의 연속된 프레임들에 대응되는 구간에 대해 주파수 대역 별 스펙트럼 에너지와 연관된 표준편차를 계산하는 단계; 및상기 계산된 표준편차에 기초하여 상기 구간을 음성 구간 및 비음성 구간 중 하나로 결정하는 단계를 포함하고,상기 주파수 대역 별 스펙트럼 에너지와 연관된 표준편차를 계산하는 단계는,복수의 주파수 대역들 각각에 대해 프레임 별로 스펙트럼 에너지의 1차 편차를 계산하고, 상기 계산된 1차 편차들의 평균을 구하는 단계; 상기 프레임 별로 계산된 1차 편차에서 상기 계산된 1차 편차들의 평균을 감산함으로써 프레임 별 스펙트럼 에너지의 2차 편차를 계산하는 단계;상기 2차 편차에 기초하여 상기 복수의 주파수 대역들 각각에 대한 2차 표준편차를 계산하는 단계; 및상기 복수의 주파수 대역들에 대해 계산된 2차 표준편차들의 평균을 구하는 단계를 포함하는, 방법
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
제 1항에 있어서,상기 구간을 음성 구간 및 비음성 구간 중 하나로 결정하는 단계는,상기 2차 표준편차들의 평균이 기 설정된 임계값을 초과하는 경우 상기 구간을 음성 구간으로 결정하는 단계를 포함하는, 방법
|
7 |
7
제 6항에 있어서,상기 기 설정된 임계값은 상기 음성 신호의 SNR에 상관없이 동일하게 결정되는, 방법
|
8 |
8
제 6항에 있어서,상기 기 설정된 임계값은 음성 구간 검출의 성능 평가 결과에서 False Alarm 오류율 및 False reject 오류율의 합이 최소가 되도록 결정된 것인, 방법
|
9 |
9
제 1항에 있어서,상기 음성 신호는 순수 음성 신호 및 잡음 신호를 포함하는, 방법
|
10 |
10
제 1항에 있어서,상기 복수의 프레임들로 분할된 음성 신호를 주파수 영역으로 변환하는 단계는,상기 분할된 복수의 프레임들 각각에 해밍 윈도우를 적용하는 단계; 및상기 해밍 윈도우가 적용된 음성 신호에 대해 고속 푸리에 변환(Fast Fourier Transform: FFT)를 수행하는 단계를 포함하는, 방법
|
11 |
11
제 1항의 방법을 실행하는 명령어들을 포함하는 하나 이상의 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록매체
|
12 |
12
음성 구간을 검출하는 장치에 있어서,잡음 환경에서 음성 신호를 수신하는 수신기; 및상기 수신된 음성 신호를 복수의 프레임들로 분할하고, 상기 복수의 프레임들로 분할된 음성 신호를 주파수 영역으로 변환하며, 상기 복수의 프레임들 중 특정 개수의 연속된 프레임들에 대응되는 구간에 대해 주파수 대역 별 스펙트럼 에너지와 연관된 표준편차를 계산하고, 상기 계산된 표준편차에 기초하여 상기 구간을 음성 구간 및 비음성 구간 중 하나로 결정하는 제어부를 포함하고,상기 제어부는,복수의 주파수 대역들 각각에 대해 프레임 별로 스펙트럼 에너지의 1차 편차를 계산하고, 상기 계산된 1차 편차들의 평균을 구하고,상기 프레임 별로 계산된 1차 편차에서 상기 계산된 1차 편차들의 평균을 감산함으로써 프레임 별 스펙트럼 에너지의 2차 편차를 계산하며,상기 2차 편차에 기초하여 상기 복수의 주파수 대역들 각각에 대한 2차 표준편차를 계산하고,상기 복수의 주파수 대역들에 대해 계산된 2차 표준편차들의 평균을 구하는, 장치
|