1 |
1
음성 인식을 위해 미리 수집된 복수개의 문장이 저장된 문장 코퍼스; 상기 문장 코퍼스로부터 상기 복수개의 문장 중 적어도 하나의 문장을 획득하고, 획득된 상기 문장을 기설정된 인식 단위로 구분하는 인식단위 구분부; 상기 인식단위로 구분된 문장의 구문을 분석하는 구문 분석부; 음성 합성을 위해 기설정된 끊어읽기 규칙을 기초로 설정되는 끊어읽기 규칙이 기저장된 끊어읽기 규칙 데이터베이스; 상기 구문 분석부에 의해 분석된 구문을 이용하여 상기 복수개의 끊어읽기 규칙 중 대응하는 끊어읽기 규칙을 검색하여 획득하고, 획득된 끊어읽기 규칙에 따라 상기 인식단위로 구분된 문장에 기설정된 끊어읽기 표시를 삽입하는 끊어읽기 삽입부; 언어모델이 저장되는 언어모델 데이터베이스; 및 상기 끊어읽기 삽입부에서 끊어읽기 표시가 삽입된 문장을 수신하여 기설정된 방식으로 언어모델로 생성하여 상기 언어모델 데이터베이스에 저장하는 언어모델 생성부; 를 포함하는 언어모델 생성 장치
|
2 |
2
제1 항에 있어서, 상기 끊어읽기 규칙 데이터베이스는 상기 음성 합성을 위해 설정된 복수개의 끊어읽기 규칙 중 기실험적으로설정된 발화자가 실제로 끊어읽는 확률이 기준 끊어읽기 확률 이상인 끊어읽기 규칙을 저장하는 것을 특징으로 하는 언어모델 생성 장치
|
3 |
3
제1 항에 있어서, 상기 언어모델 생성부는 상기 끊어읽기 표시가 삽입된 문장과 상기 인식단위로 구분된 문장을 모두 상기 언어모델로 변환하여 상기 언어모델 데이터베이스에 저장하는 것을 특징으로 하는 언어모델 생성 장치
|
4 |
4
제1 항에 있어서, 상기 언어모델 생성부는 상기 끊어읽기 표시가 삽입된 문장 중 상기 끊어읽기 표시와 상기 끊어읽기 표시를 기준으로 전후로 기설정된 개수의 단어와 상기 인식단위로 구분된 문장을 상기 언어모델 데이터베이스에 저장하는 것을 특징으로 하는 언어모델 생성 장치
|
5 |
5
제1 항에 있어서, 상기 문장 코퍼스는 상기 언어모델 데이터베이스와 동일한 데이터베이스로 구현되는 것을 특징으로 하는 언어모델 생성 장치
|
6 |
6
제1 항에 있어서, 언어모델 생성 장치는 외부로부터 사용자 명령을 수신하고, 수신된 사용자 명령에 응답하여 상기 인식단위를 설정하여 상기 인식단위 구분부로 전송하는 인식단위 설정부; 를 더 포함하는 것을 특징으로 하는 언어모델 생성 장치
|
7 |
7
제1 항에 있어서, 상기 언어모델 생성부는 상기 인식단위 구분부로부터 상기 인식단위로 구분된 문장을 수신하여 제1 언어모델을 생성하는 제1 언어모델 생성부; 상기 끊어어읽기 삽입부로부터 상기 끊어읽기 표시가 삽입된 문장을 수신하여 제2 언어모델을 생성하는 제2 언어모델 생성부; 및 상기 제1 언어모델 및 상기 제2 언어모델을 보간하여 상기 언어모델을 생성하고, 생성된 언어모델을 상기 언어모델 데이터베이스에 저장하는 보간부; 를 포함하는 것을 특징으로 하는 언어모델 생성 장치
|
8 |
8
제7 항에 있어서, 상기 보간부는 상기 제1 언어모델과 상기 제2 언어모델의 차이를 비교하여, 상기 제2 언어모델에서 상기 끊어읽기 표시가 삽입된 위치 정보를 상기 제1 언어모델에 삽입하는 것을 특징으로 하는 언어모델 생성 장치
|
9 |
9
음성 인식을 위해 미리 수집된 복수개의 문장이 저장된 문장 코퍼스와 음성 합성을 위해 기설정된 끊어읽기 규칙을 기초로 설정되는 끊어읽기 규칙이 기저장된 끊어읽기 규칙 데이터베이스를 포함하는 언어모델 생성 장치의 언어모델 생성 방법에 있어서, 상기 언어모델 생성 장치가 상기 문장 코퍼스로부터 상기 복수개의 문장 중 적어도 하나의 문장을 획득하는 단계; 상기 획득된 상기 문장을 기설정된 인식 단위로 구분하는 단계; 상기 인식단위로 구분된 문장의 구문을 분석하고, 상기 분석된 구문을 이용하여 상기 복수개의 끊어읽기 규칙 중 대응하는 끊어읽기 규칙을 검색하여 획득하는 단계; 상기 획득된 끊어읽기 규칙에 따라 상기 인식단위로 구분된 문장에 기설정된 끊어읽기 표시를 삽입하는 단계; 상기 끊어읽기 표시가 삽입된 문장을 기설정된 방식으로 언어모델로 생성하는 단계; 및 상기 언어모델을 언어모델 데이터베이스에 저장하는 단계; 를 포함하는 언어모델 생성 방법
|
10 |
10
제9 항에 있어서, 상기 끊어읽기 규칙 데이터베이스는 상기 음성 합성을 위해 설정된 복수개의 끊어읽기 규칙 중 기실험적으로설정된 발화자가 실제로 끊어읽는 확률이 기준 끊어읽기 확률 이상인 끊어읽기 규칙을 저장하는 것을 특징으로 하는 언어모델 생성 방법
|
11 |
11
제9 항에 있어서, 상기 언어모델로 생성하는 단계는 상기 인식단위로 구분된 문장 또한 상기 언어모델로 생성하는 것을 특징으로 하는 언어모델 생성 방법
|
12 |
12
제11 항에 있어서, 상기 언어모델 데이터베이스에 저장하는 단계는 상기 끊어읽기 표시가 삽입된 문장과 상기 인식단위로 구분된 문장을 모두 상기 언어모델 데이터베이스에 저장하는 것을 특징으로 하는 언어모델 생성 방법
|
13 |
13
제11 항에 있어서, 상기 언어모델 데이터베이스에 저장하는 단계는 상기 끊어읽기 표시가 삽입된 문장 중 상기 끊어읽기 표시와 상기 끊어읽기 표시를 기준으로 전후로 기설정된 개수의 단어와 상기 인식단위로 구분된 문장을 상기 언어모델 데이터베이스에 저장하는 것을 특징으로 하는 언어모델 생성 방법
|
14 |
14
제9 항에 있어서, 상기 언어모델로 생성하는 단계는 상기 인식단위로 구분된 문장을 수신하여 제1 언어모델을 생성하는 단계; 상기 끊어읽기 표시가 삽입된 문장을 수신하여 제2 언어모델을 생성하는 단계; 및 상기 제1 언어모델 및 상기 제2 언어모델을 보간하여 상기 언어모델을 생성하는 단계; 를 포함하는 것을 특징으로 하는 언어모델 생성 방법
|
15 |
15
제9 항 내지 제14 항 중 어느 한 항에 따른 상기 언어모델 생성 방법을 수행하기 위한 컴퓨터로 판독가능한 프로그램을 기록한 기록 매체
|