1 |
1
시간영역에서 주어진 음성신호 및 미리 제공된 M개의 음성커널을 이용하여 상기 음성신호의 특징정보를 추출하기 위한 특징정보추출 프로세스를 포함하는 음성특징정보 추출방법으로서,상기 특징정보추출 프로세스는,상기 M개의 음성커널 각각을 L개의 서로 다른 이격시간만큼 이동하여 얻은 총 M*L개의 기준신호를 이용하며,상기 M*L개의 기준신호 각각에 대하여 상기 음성신호를 내적하는 연산을 수행함으로써 얻은 M*L개의 내적값 중 최대값을 구하고, 상기 M개의 음성커널 중 상기 최대값에 대응하는 음성커널을 최대음성커널로서 선택하고, 상기 L개의 서로 다른 이격시간 중 상기 최대값에 대응하는 이격시간을 최대음성커널 발생시점으로서 선택하는 단계; 및상기 최대음성커널, 상기 최대음성커널 발생시점, 및 상기 최대값에 관한 정보를 상기 음성신호의 단위음성특징정보로서 제공하는 단계; 를 포함하는,음성특징정보 추출방법
|
2 |
2
제1항에 있어서, 상기 M개의 음성커널은 M개의 중심주파수에 대한 기저막(basilar membrane)의 움직임을 시간에 따른 진폭으로 모델링한 신호인 것을 특징으로 하는, 음성특징정보 추출방법
|
3 |
3
제1항에 있어서, 상기 M*L개의 기준신호 중 상기 최대값에 대응하는 기준신호에 상기 최대값을 곱하여 최대정규기준신호를 생성하는 단계; 및상기 특징정보추출 프로세스에서 이용된 상기 음성신호로부터 상기 최대정규기준신호를 차감하여 레지듀얼 음성신호를 제공하는 단계;를 포함하는 음성신호갱신 프로세스를 더 포함하는,음성특징정보 추출방법
|
4 |
4
제3항에 있어서, 상기 음성신호갱신 프로세스 이후에 상기 특징정보추출 프로세스를 다시 수행하되, 상기 다시 수행되는 특징정보추출 프로세스에서 상기 M*L개의 기준신호 각각에 대하여 내적되어야 하는 상기 음성신호가 상기 음성신호갱신 프로세스에서 얻은 상기 레지듀얼 음성신호로 대체되는 것을 특징으로 하는, 음성특징정보 추출방법
|
5 |
5
제4항에 있어서, 상기 특징정보추출 프로세스와 상기 음성신호갱신 프로세스를 순차적으로 반복하여 수행하되, 상기 특징정보추출 프로세스에서 얻은 최대값이 미리 결정된 값보다 작게 되면 상기 반복을 멈추도록 되어 있는, 음성특징정보 추출방법
|
6 |
6
제5항에 있어서,상기 반복이 멈출 때까지 상기 특징정보추출 프로세스가 총 K번 수행되었다면, 상기 K번의 특징정보추출 프로세스를 통해 제공된 K개의 상기 단위음성특징정보의 집합을 상기 음성신호의 음성특징정보로서 제공하는, 음성특징정보 추출방법
|
7 |
7
제6항에 따른 음성특징정보를 이용하여 음성신호를 인식하는 방법으로서,상기 음성신호와는 다른 비교음성신호를 이용하여 상기 특징정보추출 프로세스 및 상기 음성신호갱신 프로세스를 수행함으로써, 상기 비교음성신호에 대한 음성특징정보인 비교음성특징정보를 추출하는 단계; 및상기 음성특징정보와 상기 비교음성특징정보의 유사도를 추출하는 단계를 포함하는,음성신호 인식방법
|
8 |
8
한 개 프레임의 음성신호를 제공받는 단계;상기 음성신호로부터 한 개 이상의 음성커널 성분을 추출하는 단계;상기 추출된 한 개 이상의 음성커널 성분 각각의 발생시점과 크기를 결정하는 단계; 및상기 추출된 한 개 이상의 음성커널 성분에 대응하는 음성커널과, 상기 결정된 발생시점, 및 상기 결정된 크기를 상기 음성신호의 음성특징정보로서 제공하는 단계;를 포함하는,음성특징정보 추출방법
|
9 |
9
제8항에 있어서, 상기 음성커널은 복수 개의 중심주파수에 대한 기저막의 움직임을 시간에 따른 진폭으로 모델링한 신호인 것을 특징으로 하는, 음성특징정보 추출방법
|
10 |
10
음성특징정보를 추출하는 장치로서,음성신호 및 음성커널에 대한 정보가 저장되어 있는 저장부 및 처리부를 포함하며,상기 처리부는,상기 저장부로부터 한 개 프레임의 음성신호를 제공받는 단계;상기 음성신호로부터 한 개 이상의 음성커널 성분을 추출하는 단계;상기 추출된 한 개 이상의 음성커널 성분 각각의 발생시점과 크기를 결정하는 단계; 및상기 추출된 한 개 이상의 음성커널 성분에 대응하는 음성커널과, 상기 결정된 발생시점, 및 상기 결정된 크기를 상기 음성신호의 음성특징정보로서 저장하는 단계;를 수행하도록 되어있는,음성특징정보 추출장치
|
11 |
11
처리부, 및 시간영역에서 주어진 음성신호와 미리 제공된 M개의 음성커널을 포함하는 저장부를 포함하는 음성특징정보 추출장치에서 실행되는 실행코드로서, 상기 음성특징정보 추출장치로 하여금 상기 음성신호의 특징정보를 추출하기 위한 특징정보추출 프로세스를 포함하는 음성특징정보 추출방법을 실행하도록 하는 실행코드가 기록된 컴퓨터로 읽을 수 있는 매체로서,상기 특징정보추출 프로세스는,상기 M개의 음성커널 각각을 L개의 서로 다른 이격시간만큼 이동하여 얻은 총 M*L개의 기준신호를 이용하며,상기 처리부가, 상기 M*L개의 기준신호 각각에 대하여 상기 음성신호를 내적하는 연산을 수행함으로써 얻은 M*L개의 내적값 중 최대값을 구하고, 상기 M개의 음성커널 중 상기 최대값에 대응하는 음성커널을 최대음성커널로서 선택하고, 상기 L개의 서로 다른 이격시간 중 상기 최대값에 대응하는 이격시간을 최대음성커널 발생시점으로서 선택하는 단계; 및상기 최대음성커널, 상기 최대음성커널 발생시점, 및 상기 최대값에 관한 정보를 상기 음성신호의 단위음성특징정보로서 제공하는 단계; 를 수행하도록 되어 있는,컴퓨터로 읽을 수 있는 매체
|
12 |
12
한 개 프레임의 음성신호를 제공받는 단계; 상기 음성신호로부터 한 개 이상의 음성커널 성분을 추출하는 단계; 상기 추출된 한 개 이상의 음성커널 성분 각각의 발생시점과 크기를 결정하는 단계; 및 상기 추출된 한 개 이상의 음성커널 성분에 대응하는 음성커널과, 상기 결정된 발생시점, 및 상기 결정된 크기를 상기 음성신호의 음성특징정보로서 제공하는 단계;를 포함하는 음성특징정보 추출 프로세스를 이용하는 음성인식 방법으로서,미리 제공된 기준음소 신호로부터 상기 음성특징정보 추출 프로세스를 이용하여 추출한 상기 음성특징정보인 기준-음성특징정보를 제공하는 단계;음성인식을 실행할 입력신호로부터 상기 음성특징정보 추출 프로세스를 이용하여 추출한 상기 음성특징정보인 입력-음성특징정보를 제공하는 단계; 및상기 기준-음성특징정보가 나타내는 벡터와 상기 입력-음성특징정보가 나타내는 벡터 간의 거리의 크기를 기준으로 상기 입력신호가 상기 기준음소 신호와 동일한지 여부를 판단하는 단계를 포함하는,음성인식방법
|