1 |
1
말뭉치로부터 발음 텍스트를 생성하는 단계; 상기 발음 텍스트에 포함된 단어들 중 발음 사전에 등록되지 않은 미등록 단어가 있는지 확인하는 단계; 상기 확인 결과 미등록 단어가 있는 경우, 기 구축된 음향 모델을 참조하여 해당 미등록 단어에 대한 어휘 모델 정보를 생성하는 단계; 및 상기 생성된 어휘 모델 정보를 기 구축된 어휘 모델에 추가하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
2 |
2
제 1 항에 있어서, 상기 미등록 단어의 발음 텍스트를 상기 발음 사전에 추가하는 단계를 더 포함하는 음성 인식 데이터 베이스 확장 방법
|
3 |
3
제 1 항에 있어서, 상기 미등록 단어에 포함된 인접 음소들 중 앞에 위치한 음소에 대한 후보 그룹이 갖는 확률 값을 기반으로, 상기 인접 음소들의 연결 확률을 결정하는 단계; 및 상기 결정된 연결 확률을 기반으로 상기 기 구축된 음향 모델을 수정하는 단계를 더 포함하는 음성 인식 데이터 베이스 확장 방법
|
4 |
4
제 3 항에 있어서, 상기 인접 음소들의 연결 확률을 결정하는 단계는, 상기 후보 그룹에 존재하는 연결 확률 중 가장 높은 연결 확률을 상기 인접 음소들의 연결 확률로 결정하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
5 |
5
제 1 항에 있어서, 상기 어휘 모델 정보를 생성하는 단계는, 상기 발음 텍스트 상에서 미등록 단어와 등록 단어가 서로 인접하거나 미등록 단어와 미등록 단어가 서로 인접하는 경우, 해당 인접 단어들 간의 관계를 기반으로 해당 인접 단어들에 대한 어휘 모델 정보를 생성하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
6 |
6
제 5 항에 있어서, 상기 어휘 모델 정보를 생성하는 단계는, 상기 인접 단어들 중 앞에 위치하는 단어의 다음 예정 단어군에, 상기 인접하는 단어들 중 뒤에 위치하는 단어를 추가하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
7 |
7
제 6 항에 있어서, 상기 어휘 모델 정보를 생성하는 단계는, 상기 인접 단어들 중 앞에 위치하는 단어에 대한 후보 그룹이 갖는 확률 값을 기반으로, 상기 인접 단어들의 연결 확률을 결정하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
8 |
8
제 7 항에 있어서, 상기 인접 단어들의 연결 확률을 결정하는 단계는, 상기 후보 그룹에 존재하는 연결 확률 중 가장 높은 연결 확률을 상기 인접 단어들의 연결 확률로 결정하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
9 |
9
제 1 항에 있어서, 상기 발음 텍스트에 포함된 등록 단어들 중 서로 인접하는 인접 단어들 간의 관계가 상기 기 구축된 언어 모델에 반영되어 있는지 확인하는 단계; 상기 인접 단어들 간의 관계가 상기 기 구축된 언어 모델에 반영되어 있지 않는 경우, 상기 인접 단어들 간의 관계를 나타내는 언어 모델 정보를 생성하는 단계; 및 상기 생성된 언어 모델 정보를 상기 기 구축된 언어 모델에 추가하는 단계를 더 포함하는 음성 인식 데이터 베이스 확장 방법
|
10 |
10
제 9 항에 있어서, 상기 언어 모델 정보를 생성하는 단계는, 상기 인접 단어들을 단어 연결 단위군으로 정의하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
11 |
11
제 10 항에 있어서, 상기 언어 모델 정보를 생성하는 단계는, 상기 인접 단어들 중 앞에 위치하는 단어에 대한 후보 그룹이 갖는 확률 값을 기반으로, 상기 인접 단어들의 연결 확률을 결정하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
12 |
12
제 11 항에 있어서, 상기 인접 단어들의 연결 확률을 결정하는 단계는, 상기 후보 그룹에 존재하는 연결 확률 중 가장 높은 연결 확률을 상기 인접 단어들의 연결 확률로 결정하는 단계를 포함하는 음성 인식 데이터 베이스 확장 방법
|
13 |
13
프로세서 및 메모리를 포함하는 음성 인식 데이터 베이스 확장 장치로서, 상기 메모리에 음성 인식 데이터 베이스를 확장하기 위한 명령어들이 저장되며, 상기 명령어들은, 상기 프로세서에 의해 실행될 때, 상기 프로세서로 하여금, 말뭉치로부터 발음 텍스트를 생성하고, 상기 발음 텍스트에 포함된 단어들 중 발음 사전에 등록되지 않은 미등록 단어가 있는지 확인하며, 상기 확인 결과 미등록 단어가 있는 경우 기 구축된 음향 모델을 참조하여 해당 미등록 단어에 대한 어휘 모델 정보를 생성하고, 상기 생성된 어휘 모델 정보를 기 구축된 어휘 모델에 추가하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
14 |
14
제 13 항에 있어서, 상기 명령어들은, 상기 미등록 단어에 포함된 인접 음소들 중 앞에 위치한 음소에 대한 후보 그룹이 갖는 확률 값을 기반으로 상기 인접 음소들의 연결 확률을 결정하고, 상기 결정된 연결 확률을 기반으로 상기 기 구축된 음향 모델을 수정하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
15 |
15
제 13 항에 있어서, 상기 명령어들은, 상기 발음 텍스트 상에서 미등록 단어와 등록 단어가 서로 인접하거나 미등록 단어와 미등록 단어가 서로 인접하는 경우, 해당 인접 단어들 간의 관계를 기반으로 해당 인접 단어들에 대한 어휘 모델 정보를 생성하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
16 |
16
제 15 항에 있어서, 상기 명령어들은, 상기 인접 단어들 중 앞에 위치하는 단어의 다음 예정 단어군에, 상기 인접 단어들 중 뒤에 위치하는 단어를 추가하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
17 |
17
제 16 항에 있어서, 상기 명령어들은, 상기 인접 단어들 중 앞에 위치하는 단어에 대한 후보 그룹이 갖는 확률 값을 기반으로 상기 인접 단어들의 연결 확률을 결정하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
18 |
18
제 13 항에 있어서, 상기 명령어들은, 상기 발음 텍스트에 포함된 등록 단어들 중 서로 인접하는 인접 단어들 간의 관계가 상기 기 구축된 언어 모델에 반영되어 있는지 확인하고, 상기 인접 단어들 간의 관계가 상기 기 구축된 언어 모델에 반영되어 있지 않는 경우, 상기 인접 단어들 간의 관계를 나타내는 언어 모델 정보를 생성하며, 상기 생성된 언어 모델 정보를 상기 기 구축된 언어 모델에 추가하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
19 |
19
제 18 항에 있어서, 상기 명령어들은, 상기 인접 단어들을 단어 연결 단위군으로 정의하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|
20 |
20
제 19 항에 있어서, 상기 명령어들은, 상기 인접 단어들 중 앞에 위치하는 단어에 대한 후보 그룹이 갖는 확률 값을 기반으로 상기 인접 단어들의 연결 확률을 결정하도록 하는 명령어들을 포함하는 음성 인식 데이터 베이스 확장 장치
|