1 |
1
입력된 신호를 프레임화시켜 음성신호의 시작점후보와 끝점을 검출하기 위한 프레임 임계에너지 및 임계 영교차율과, 음성/비음성을 판별하기 위한 임계 프레임 갯수를 설정하는 임계치 설정단계를 수행하고; 상기 임계치설정단계 이후에 입력된 외부신호를 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하고 상기 임계 에너지 및 임계 영교차율과 비교하여 음성프레임여부를 판정하고 음성프레임에 대하여 시작점 후보를 구하는 시작점후보 검출단계를 수행하고; 상기 시작점후보 검출단계 이후에 입력되는 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후, 검출된 피치로부터 음성과 비음성을 판정하는 피치분석에 의한 음성판정단계를 수행하고; 상기 음성판정단계에서 비음성으로 판정될 경우에는 다시 시작점 후보를 구하는 단계를 수행하게 하고, 음성으로 판정된 경우에는 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 음성신호의 끝점을 구하는 끝점 검출단계를 수행하여, 비음성 잡음을 배제하고 음성신호의 시작점과 끝점에 의해 검출되어지는 음성신호에 대해서만 음성인식시스템으로 입력하게 하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
2 |
2
제 1 항에 있어서, 상기 임계치 설정단계는, 초기에 입력되는 묵음신호의 에너지와 영교차율에 의거하여 임계 에너지와 임계영교차율을 설정하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
3 |
3
제 1 항에 있어서, 상기 음성신호의 시작점 후보 검출단계는, 음성신호가 입력되면 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하는 단계와; 상기 프레임의 에너지가 상기 임계치 설정단계에서 설정된 임계 에너지보다 크거나 상기 프레임의 영교차율이 상기 임계치 설정단계에서 설정된 임계 영교차율보다 클 경우 그 프레임을 음성프레임으로 판정하는 단계와; 상기 시작점 후보검출에서 입력되는 프레임들중에서 음성으로 판정된 프레임들을 누적하여 그 누적된 갯수가 상기 임계치 설정단계의 시작점 후보 판단 임계 프레임 갯수를 초과할 때 그 초과시점의 프레임에서 임계 프레임의 개수만큼 이전에 위치한 프레임을 음성신호의 시작점 후보로 검출하는 단계로 이루어지는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
4 |
4
제 1 항에 있어서, 상기 피치분석에 의한 음성판정단계는, 상기 시작점 후보 검출이후에 입력되는 프레임을 소정구간으로 나누고 상기 구간내의 프레임별 에너지레벨에 의거하여 유성음 구간을 검출하는 단계와; 상기 유성음구간으로 검출된 프레임 구간에 대하여 상호상관계수를 검출해내는 단계와; 상기 상호상관 계수들에 대하여 피크피킹방법에 의해 상호 상관 계수중 최대치의 인덱스를 피치로서 검출하는 단계와; 검출된 피치가 음성으로 판단할 수 있는 소정의 피치 구간내에 있으면서, 최대 상호상관계수값이 임계치보다 크면 음성으로 판정하여 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 비음성으로 판정되는 경우에는 상기 시작점 후보를 검출하게 하는 단계를 수행하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
5 |
5
제 4 항에 있어서, 상기 유성음 구간 검출 단계는, 음성신호 시작점 후보 검출단계에서 검출된 시작점후보 이후부터 입력된 소정 구간의 프레임들중에서 최대의 에너지 레벨을 가지는 프레임을 구한후 이 프레임 및 주변 소정의 프레임을 유성음 프레임으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
6 |
6
제 1 항에 있어서, 상기 음성신호의 끝점 검출단계는, 상기 시작점 후보 이후의 프레임들이 상기 검출된 피치에 의해 비음성으로 판정될 경우 다시 상기 음성신호의 시작점 후보를 검출하게 하는 단계를 수행하게 하고, 상기 시작점 후보 이후의 프레임들이 음성으로 판정될 경우 연속적으로 읽여지는 프레임들중에서 비음성으로 판정되는 프레임들의 누적된 갯수가 상기 임계치 설정 단계에서 설정된 음성 신호의 끝점 판단 임계 프레임 갯수를 초과할 때 그 프레임을 음성신호의 끝점으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출방법
|
7 |
7
마이크를 통해 외부신호를 입력받아 아날로그 음성신호를 디지털 변환시키는 신호 입력수단과; 상기 입력수단을 통해 입력된 신호를 프레임화시켜 음성신호의 시작점후보와 끝점을 검출하기 위한 프레임 임계에너지 및 임계 영교차율과, 음성/비음성을 판별하기 위한 임계프레임갯수를 설정하는 임계치 설정부와, 각 프레임 단위별 에너지와 영교차율을 구하고 상기 임계치 설정부에 서 설정된 상기 임계 에너지 및 임계 영교차율과 비교하여 음성프레임여부를 판정하여 음성프레임에 대하여 시작점 후보를 검출하는 시작점 후보 검출부와, 시작점 후보가 검출되어진 이후의 프레임들에 대한 음성/비음성여부에 따라 음성으로 판정된 경우에 상기 음성의 시작점 후보를 음성의 시작점으로 결정하고 음성신호의 끝점을 구하는 끝점 검출부로 이루어진 음성신호의 시작점 후보 및 끝점 검출수단과; 음성신호의 시작점 및 끝점 검출수단에 의해 검출된 시작점 후보 이후로 입력되는 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후 검출된 피치로부터 음성과 비음성을 판정하는 음성판정수단으로 구성되어; 비음성 잡음은 배제하고 시작점 검출과 끝점 검출에 의한 음성신호만을 음성인식시스템으로 입력하게 하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치
|
8 |
8
제 7 항에 있어서, 상기 음성신호의 시작점 후보 및 끝점 검출수단의 임계치 설정부는, 초기 입력신호인 묵음신호의 에너지 및 영교차율에 의거하여 임계에너지와 임계영교차율을 설정하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치
|
9 |
9
제 7 항에 있어서, 상기 음성신호의 시작점 후보 및 끝점 검출수단의 시작점 후보 검출부는, 음성신호가 입력되면 연속적으로 프레임화하여 각 프레임 단위별로 에너지와 영교차율을 구하고, 상기 프레임의 에너지가 미리 설정된 임계 에너지보다 크거나, 상기 프레임의 영교차율이 미리 설정된 임계 영교차율보다 클 경우 그 프레임을 음성프레임으로 판정하며 상기 연속적으로 읽여지는 프레임들중에서 음성으로 판정된 프레임들의 누적된 수가 미리 설정된 시작점 판단 임계 프레임수를 초과할 때 그 초과 시점의 프레임에서 임계 프레임수 만큼 이전의 지점을 음성신호의 시작점 후보로서 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출수단
|
10 |
10
제 7 항에 있어서, 상기 음성신호의 시작점 후보 및 끝점 검출수단의 끝점검출부는, 검출된 음성 신호의 시작점 후보 이후의 프레임에 대하여 유성음 구간을 검출하고 이 구간에 대하여 피치를 검출한 후 검출된 피치로부터 음성과 비음성을 판정하고, 상기 시작점 후보 이후의 프레임들이 상기 검출된 피치에 의해 음성으로 판정될 경우 연속적으로 읽여지는 프레임들중에서 비음성으로 판정되는 프레임들의 누적된 갯수가 미리 설정된 음성 프레임의 끝점 판단 임계 프레임 갯수를 초과할 때 그 프레임을 음성신호의 끝점으로 검출하는 것을 특징으로 하는 피치 정보를 이용한 음성부 검출장치
|