1 |
1
학습에 의해 구축된 음향모델 데이터베이스 및 발음사전 데이터베이스를 포함하는 대화체 연속음성인식 장치에 있어서, 입력된 음성으로부터 인식에 유용한 정보만을 추출하여 특징벡터로 변환하는 특징 추출부; 인식하고자 하는 영역의 대화를 특정 영역별로 세분화하여 다수의 로컬 언어모델 데이터베이스들로 구축하고, 상기 세분화된 특정 영역에 포함되지 않는 일반 대화를 광범위 언어모델 데이터베이스로 각각 구축하고, 상기 특징벡터에 따라 상기 다수의 로컬 언어모델 데이터베이스들에서 추출된 언어모델과 광범위한 언어모델 데이터베이스에서 추출된 언어모델을 인터폴레이션하는 다중영역 언어모델링부; 상기 음향모델 데이터베이스, 상기 발음사전 데이터베이스 및 상기 다중영역 언어모델링부를 참조하여 상기 특징벡터와 유사할 확률이 가장 높은 단어열을 탐색하는 탐색부; 및 상기 탐색부에서 탐색된 단어열을 인식된 텍스트로서 출력하는 인식 결과 출력부를 포함하는 것을 특징으로 하는 대화체 연속음성인식 장치
|
2 |
2
제1항에 있어서, 상기 다중영역 언어모델링부는 상기 로컬 언어모델 데이터베이스들에서 추출된 언어모델에 광범위 언어모델 데이터베이스에서 추출된 언어모델보다 높은 가중치를 부여하여 인터폴레이션하는 것을 특징으로 하는 대화체 연속음성인식 장치
|
3 |
3
제2항에 있어서, 상기 인터폴레이션은 영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 장치
|
4 |
4
제1항에 있어서, 상기 탐색부는 비터비 알고리듬을 이용하여 단어열을 탐색하는 것을 특징으로 하는 대화체 연속음성인식 장치
|
5 |
5
(a)입력된 음성으로부터 음성인식에 유용한 정보만을 추출하여 특징벡터로 변환하는 단계; (b)학습과정에서 미리 구축된 음향모델 데이터베이스 및 발음사전 데이터베이스와 다중영역 언어모델링을 이용하여 상기 특징 벡터와 유사할 확률이 가장 높은 단어열을 탐색하는 단계; 및 (c)상기 (b)단계에서 탐색된 단어열을 인식된 텍스트로서 생성하는 단계를 포함하는 것을 특징으로 하는 대화체 연속음성인식 방법
|
6 |
6
제5항에 있어서, 상기 다중영역 언어모델링은 인식하고자 하는 영역의 대화를 특정 영역별로 세분화하여 구축된 다수의 로컬 언어모델 데이터베이스들과 상기 세분화된 특정 영역에 포함되지 않는 일반 대화를 수집한 광범위 언어모델 데이터베이스를 참조하여, 상기 특징벡터에 따라 상기 다수의 로컬 언어모델 데이터베이스들에서 추출된 언어모델과 광범위한 언어모델 데이터베이스에서 추출된 언어모델을 인터폴레이션하는 것을 특징으로 하는 대화체 연속음성인식 방법
|
7 |
7
제6항에 있어서, 상기 인터폴레이션은 상기 로컬 언어모델 데이터베이스들에서 추출된 언어모델에 광범위 언어모델 데이터베이스에서 추출된 언어모델보다 높은 가중치를 부여하는 것을 특징으로 하는 대화체 연속음성인식 방법
|
8 |
8
제6항에 있어서, 상기 인터폴레이션은 영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 방법
|
9 |
9
제5항에 있어서, 상기 (b)단계는 비터비 알고리듬을 이용하여 단어열을 탐색하는 것을 특징으로 하는 대화체 연속음성인식 방법
|
10 |
10
제5항의 대화체 연속음성인식 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록된 기록 매체
|
11 |
11
(a)언어모델링을 하고자하는 영역을 세분화하여 세분화된 다수의 로컬 언어모델 데이터베이스들을 구축하는 단계; (b)상기 (a)단계에서 세부적 언어영역으로 구분되지 않은 영역의 대화들을 수집하여 광범위 언어모델 데이터베이스로서 구축하는 단계; (c)입력된 음성으로부터 추출된 특징 벡터와 유사할 확률이 높은 언어모델을 상기 다수의 로컬 언어모델 데이터베이스들에서 추출하는 단계; (d)상기 특징 벡터와 유사할 확률이 높은 언어모델을 상기 광범위 언어모델 데이터베이스로부터 추출하는 단계; 및 (e)상기 (c) 및 (d)단계에서 추출된 언어모델 각각에 소정의 가중치를 부여하여 인터폴레이션하는 단계를 포함하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법
|
12 |
12
제11항에 있어서, 상기 (e)단계의 인터폴레이션은 상기 (d)단계에서 추출된 언어모델보다 상기 (c)단계에서 추출된 언어모델에 높은 가중치를 부여하여 상기 로컬 언어모델 데이터베이스에서 추출된 언어모델을 강조하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법
|
13 |
13
제11항에 있어서, 상기 (e)단계의 인터폴레이션은 영역별 n-gram의 카운트를 일정 비율로 높여주어, 디스카운팅 직전에 다음 수학식에 따라 재분배하는 것을 특징으로 하는 대화체 연속음성인식 장치에서 수행되는 다중영역 언어모델링 방법
|
14 |
14
제11항의 다중영역 언어모델링 방법을 컴퓨터에서 실행 가능한 프로그램 코드로 기록된 기록 매체
|