1 |
1
입력되는 음성 데이터로부터 특징 벡터를 추출하고, 음성/비음성 모델을 이용하여 특징 벡터가 음성에 해당하는 것인지 비음성에 해당하는 것인지 구분하는 음성/비음성 검증부; 및상기 음성/비음성 검증부가 음성으로 판단한 구간에 대응하는 데이터로부터 음성을 인식하는 음성 인식부를 포함하되,상기 음성/비음성 검증부는,상기 입력되는 음성 데이터를 프레임 단위로 나누어 상기 프레임 단위의 음성 데이터로부터 필터 뱅크 에너지, 피치, 프레임내에 필터 뱅크간의 에너지 값의 변화량, 프레임간의 필터뱅크 에너지 값의 변화량 및 멜 필터 뱅크 계수 중 적어도 어느 하나의 특징 벡터를 추출하며,상기 음성/비음성 모델을 이용하여 상기 프레임 단위의 음성 데이터에 대하여 음성/비음성 결정을 수행한 후, 연속하는 복수의 프레임의 음성/비음성 결정 값을 창의 길이만큼 버퍼링하여 창 단위로 음성/비음성 결정을 내리는 것을 특징으로 하는 음성 인식 장치
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서, 상기 음성으로 판단한 구간에 대응하는 데이터는 특징 벡터 및 음성 데이터 중 적어도 어느 하나인 음성 인식 장치
|
4 |
4
삭제
|
5 |
5
제 1항 또는 제 3항에 있어서, 단시간 에너지 및 영교차율 중 적어도 어느 하나를 이용하여 음성 구간을 검출하여 음성 구간에 대응하는 데이터를 상기 음성/비음성 검증부로 전달하는 음성 끝점 검출부를 더 포함하는 음성 인식 장치
|
6 |
6
삭제
|
7 |
7
(a) 프레임 단위의 음성 데이터로부터 특징 벡터를 추출하는 단계;(b) 음성/비음성 모델을 이용하여 프레임 단위로 음성/비음성 결정을 수행하는 단계;(c) 연속하는 복수의 프레임의 음성/비음성 결정 값을 창의 길이만큼 버퍼링하는 단계; 및(d) 창 단위로 음성/비음성 결정을 내리는 단계를 포함하며,상기 특징 벡터는 필터 뱅크 에너지, 피치, 프레임내에 필터 뱅크간의 에너지 값의 변화량, 프레임간의 필터뱅크 에너지 값의 변화량 및 멜 필터 뱅크 계수 중 적어도 어느 하나인 음성/비음성 검증 방법
|
8 |
8
삭제
|
9 |
9
제 7 항에 있어서, 상기 (b) 단계에서 음성/비음성을 결정함에 있어서, 통계적 방법 및 규칙 기반의 방법 중 적어도 어느 한 방법을 이용하여 결정하는 음성/비음성 검증 방법
|
10 |
10
제 7 항에 있어서, 상기 (c) 단계에서 상기 특징 벡터도 추가적으로 버퍼링을 수행하는 음성/비음성 검증 방법
|
11 |
11
제 7 항에 있어서, 상기 (d) 단계에서 음성/비음성을 결정함에 있어서, 통계적 방법 및 규칙 기반의 방법 중 적어도 어느 한 방법을 이용하여 결정하는 음성/비음성 검증 방법
|
12 |
12
삭제
|
13 |
13
제 7항에 있어서, 상기 (a) 단계 이후에 수행되는(f) 상기 특징 벡터를 이용하여 상기 음성/비음성 모델을 적응기법을 사용하여 재모델링 하는 단계를 더 포함하는 음성/비음성 검증 방법
|
14 |
14
제 7항에 있어서, 상기 (a) 단계 이전에 수행되는(g) 음성/비음성 모델 초기화 단계를 더 포함하는 음성/비음성 검증 방법
|
15 |
15
제 14 항에 있어서, 상기 (g) 단계는 초기화를 위한 입력 음성 데이터를 프레임 단위로 버퍼링하는 단계;버퍼링된 상기 프레임 단위의 초기화를 위한 입력 음성 데이터로부터 초기화를 위한 특징 벡터를 추출하는 단계; 및상기 초기화를 위한 특징 벡터를 이용하여 음성/비음성 모델을 만드는 단계를 포함하며,상기 초기화를 위한 특징 벡터는 필터 뱅크 에너지, 피치, 프레임내에 필터 뱅크간의 에너지 값의 변화량, 프레임간의 필터뱅크 에너지 값의 변화량 및 멜 필터 뱅크 계수 중 적어도 어느 하나인 음성/비음성 검증 방법
|