1 |
1
자연어 대화체 음성 인식 방법에 있어서,사용자의 발화에 대응되는 음성 신호를 수신하는 단계;미리 훈련된 음향 모델 및 언어 모델에 기초하여 상기 음성 신호로부터 래티스를 추출하는 단계;상기 음성 신호의 크기, 신호 대 잡음비 및 발화 속도 중 하나 이상을 분석하거나 또는 상기 음향 모델을 이용한 단어별 우도 및 신뢰도에 기초한 인식 스코어를 산출하여 상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계;상기 음향 모델 및 언어 모델에 기초하여 상기 불명확한 발성으로 추정된 구간의 재인식을 수행하는 단계 및상기 재인식 결과로부터 추출된 래티스를 상기 음성 신호로부터 추출된 래티스와 결합하는 단계를 포함하는 음성 인식 방법
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 음성 신호로부터 래티스를 추출하는 단계는,상기 음성 신호로부터 프레임 별로 특징 벡터를 추출하고, 상기 추출된 특징 벡터에 대해 음성 인식 디코딩을 수행하여 상기 래티스를 추출하는 것인 음성 인식 방법
|
4 |
4
제 3 항에 있어서,상기 음성 신호로부터 추출된 래티스는 음성 신호의 프레임 및 상기 음성 신호의 프레임을 연결하는 아크로 표현된 유한 상태 변환모델(Finite State Transducer)로 제공되는 것인 음성 인식 방법
|
5 |
5
제 4 항에 있어서,상기 각 아크에는 심볼 및 천이 확률이 할당되고, 상기 천이 확률은 음향 모델 및 언어 모델에 각각 대응되는 천이 확률을 포함하는 것인 음성 인식 방법
|
6 |
6
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 상기 음성 신호의 크기를 산출하는 단계;상기 산출된 음성 신호의 크기의 변화값이 기 설정된 크기 이상을 가지는 프레임을 추출하는 단계 및상기 추출된 프레임을 상기 불명확한 발성으로 인식되는 구간으로 추정하는 단계를 포함하는 것인 음성 인식 방법
|
7 |
7
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 상기 음성 신호의 크기를 산출하는 단계;상기 사용자의 발화의 시작점으로부터 일정 프레임에서의 묵음 구간의 에너지를 추정하는 단계;상기 추정된 에너지의 값과 상기 프레임 별 음성 신호의 크기의 비율을 산출하는 단계 및상기 산출된 비율의 추이를 분석하여 상기 불명확한 발성으로 인식되는 구간을 추정하는 단계를 포함하는 것인 음성 인식 방법
|
8 |
8
제 3 항에 있어서,상기 음성 신호 중 불명확한 발성으로 인식되는 구간을 추정하는 단계는,상기 프레임 별로 단위 시간당 모음의 개수를 산출하는 단계;상기 산출된 모음의 개수를 분석하여 발화 속도를 추정하는 단계 및상기 프레임 별 추정된 발화 속도와 전체 발화 속도를 비교하여, 기 설정된 임계값 이상 또는 기 설정된 임계값 이하의 발화 속도를 가지는 구간을 상기 불명확한 발성으로 인식되는 구간으로 추정하는 단계를 포함하는 것인 음성 인식 방법
|
9 |
9
제 5 항에 있어서,상기 재인식 결과로부터 추출된 래티스를 이용하여 리스코어링하는 단계 및상기 리스코어링된 결과에 기초하여 음성 인식 결과를 출력하는 단계를 더 포함하는 것인 음성 인식 방법
|
10 |
10
제 9 항에 있어서,상기 리스코어링된 결과에 기초하여 음성 인식 결과를 출력하는 단계는,상기 아크를 따라 진행하여 상기 천이 확률을 모두 더한 결과 최소가 되는 어휘 시퀀스를 상기 음성인식 결과로 출력하되, 추가적으로 재인식된 결과로부터 상기 음향 모델 및 언어 모델에 대응되는 천이 확률을 새로이 산출하고, 다시 상기 음성인식 결과를 산출하는 것인 음성 인식 방법
|