1 |
1
사전 학습된 잡음없는 모음의 스펙트럼에서 특징 피크가 위치한 피크 대역을 나타내는 모음특징정보를 미리 저장하는 모음특징 저장부; 및
입력 음향의 스펙트럼에서 상기 저장된 모음특징정보가 나타내는 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향이 음성에 해당하는지를 판단함으로써 음성구간을 검출하는 음성구간 검출부를 포함하는 모음 특징을 이용한 음성구간 검출 시스템
|
2 |
2
제1항에 있어서,
상기 모음특징 저장부는,
상기 모음의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출부; 및
상기 추출된 특징 피크가 상기 모음의 스펙트럼에서 위치한 피크 대역을 나타내는 모음특징정보를 생성하는 특징정보 생성부를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
3 |
3
제2항에 있어서,
상기 특징정보 생성부는, 상기 모음의 전체 스펙트럼 대역을 소정 개수의 단위 대역으로 구별하여, 상기 모음의 스펙트럼에서 상기 피크 대역에 해당하는 단위 대역을 1로 나타내고 상기 피크 대역 이외의 대역인 밸리 대역(valley band)에 해당하는 단위 대역을 0으로 나타내는 상기 모음특징정보를 생성하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
4 |
4
제1항에 있어서,
상기 음성구간 검출부는,
상기 입력 음향의 스펙트럼에서, 상기 저장된 모음특징정보의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출부; 및
상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정부를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
5 |
5
제4항에 있어서,
상기 유사도 측정부는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
6 |
6
제5항에 있어서,
상기 음성구간 검출부는, 상기 PVED 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하여 음성구간으로 검출하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
7 |
7
제6항에 있어서,
상기 음성구간 검출부는, 상기 저장된 모음특징정보들에 대하여 상기 PVED 값을 산출하고, 상기 산출된 PVED 값 중 최대 PVED 값이 상기 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
8 |
8
제6항에 있어서,
상기 음성구간 검출부는, 상기 PVED 값이 상기 임계값보다 크지 않은 경우 상기 입력 음향에 대해 행오버(Hang-over) 알고리즘을 적용하는 행오버 처리부를 더 포함하고,
상기 음성구간 검출부는, 상기 행오버 처리부에 의해 상기 입력 음향이 음성으로 처리되는 경우 상기 입력 음향을 음성으로 판단하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 시스템
|
9 |
9
음성구간 검출 시스템(Voice Activity Detection system)에서 상기 시스템에 입력되는 입력 음향들의 음성구간을 검출하는 방법에 있어서,
사전 학습된 잡음없는 모음의 스펙트럼에서 특징 피크가 위치한 피크 대역을 나타내는 모음특징정보를 미리 저장하는 모음특징 저장 단계; 및
입력 음향의 스펙트럼에서 상기 저장된 모음특징정보가 나타내는 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 이용하여 상기 입력 음향이 음성에 해당하는지를 판단함으로써 음성구간을 검출하는 음성구간 검출 단계를 포함하는 모음 특징을 이용한 음성구간 검출 방법
|
10 |
10
제9항에 있어서,
상기 모음특징 저장 단계는,
상기 모음의 스펙트럼 피크들 중 미리 결정된 문턱값(threshold)보다 큰 에너지를 지니는 피크를 특징 피크로 추출하는 특징피크 추출 단계; 및
상기 추출된 특징 피크가 상기 모음의 스펙트럼에서 위치한 피크 대역을 나타내는 모음특징정보를 생성하는 특징정보 생성 단계를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
11 |
11
제10항에 있어서,
상기 특징정보 생성 단계는, 상기 모음의 전체 스펙트럼 대역을 소정 개수의 단위 대역으로 구별하여, 상기 모음의 스펙트럼에서 상기 피크 대역에 해당하는 단위 대역을 1로 나타내고 상기 피크 대역 이외의 대역인 밸리 대역(valley band)에 해당하는 단위 대역을 0으로 나타내는 상기 모음특징정보를 생성하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
12 |
12
제9항에 있어서,
상기 음성구간 검출 단계는,
상기 입력 음향의 스펙트럼에서, 상기 저장된 모음특징정보의 상기 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 평균에너지 산출 단계; 및
상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 유사도 측정 단계를 포함하는 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
13 |
13
제12항에 있어서,
상기 유사도 측정 단계는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
14 |
14
제13항에 있어서,
상기 음성구간 검출 단계는, 상기 PVED 값이 미리 결정된 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하여 음성구간으로 검출하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
15 |
15
제14항에 있어서,
상기 음성구간 검출 단계는, 상기 저장된 모음특징정보들에 대하여 상기 PVED 값을 산출하고, 상기 산출된 PVED 값 중 최대 PVED 값이 상기 임계값보다 큰 경우 상기 입력 음향을 음성으로 판단하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
16 |
16
제14항에 있어서,
상기 음성구간 검출 단계는, 상기 PVED 값이 상기 임계값보다 크지 않은 경우 상기 입력 음향에 대해 행오버(Hang-over) 알고리즘을 적용하는 행오버 처리 단계를 더 포함하고,
상기 음성구간 검출 단계는, 상기 행오버 처리 단계에 의해 상기 입력 음향이 음성으로 처리되는 경우 상기 입력 음향을 음성으로 판단하는 단계인 것을 특징으로 하는 모음 특징을 이용한 음성구간 검출 방법
|
17 |
17
음성구간 검출 시스템(Voice Activity Detection system)에서 사전 학습된 잡음없는 모음 및 상기 시스템에 입력되는 입력 음향 간 주파수 스펙트럼의 유사도(similarity)를 측정하는 방법에 있어서,
상기 입력 음향의 스펙트럼에서, 상기 모음의 스펙트럼 상 특징 피크가 위치한 피크 대역에 대응하는 대응 대역 및 상기 대응 대역을 제외한 비대응 대역의 평균에너지를 산출하는 단계; 및
상기 대응 대역 및 상기 비대응 대역 간의 평균에너지 차를 이용하여 상기 모음 및 상기 입력 음향 간 스펙트럼 유사도를 측정하는 단계를 포함하는 음향 스펙트럼 유사도 측정 방법
|
18 |
18
제17항에 있어서,
상기 유사도 측정 단계는, 상기 대응 대역의 평균에너지에서 상기 비대응 대역의 평균에너지를 감산한 값을 나타내는 PVED(Peak-Valley Energy Difference) 값을 이용하여 상기 스펙트럼 유사도를 측정하는 단계인 것을 특징으로 하는 음향 스펙트럼 유사도 측정 방법
|
19 |
19
제9항 내지 제18항 중 어느 한 항에 따른 방법을 컴퓨터로 실행하기 위한 프로그램이 기록된 컴퓨터 판독가능 기록매체
|