1 |
1
음향모델 생성 장치에 있어서,기준 외국어 음향모델, 원어민 발성 음성 DB 및 비원어민 외국어 발성 음성 DB를 포함하는 제1 음향모델부,비원어민의 자국어 음향모델과 비원어민의 자국어 발성 음성 DB를 포함하는 제2 음향모델부, 및상기 제1 음향모델부를 기준으로, 상기 제1 음향모델부의 각 상태(state)와 유사한 것으로 판단된 상태를 제2 음향모델부에서 검색하여 맵핑 관계를 형성하고, 상기 비원어민의 자국어 발성 음성 DB를 대상으로 상태 단위의 시간 정렬을 수행하고, 프레임단위의 비원어민의 자국어 음성 구간을 추출하고, 상기 원어민 발성 음성 DB 및, 상기 비원어민 외국어 발성 음성 DB 와 함께 각 상태에 따라 추출된 상기 비원어민의 자국어 발성 음성 DB를 보강하여 상기 기준 외국어 음향모델을 훈련하여 최종 외국어 음향모델을 생성하는 음향모델 생성부를 포함하는 음향모델 생성 장치
|
2 |
2
제 1 항에 있어서,상기 기준 외국어 음향모델은 상기 원어민 발성 음성 DB 및 상기 비원어민 외국어 발성 DB를 이용하여 가우시안 혼합 모델 및 은닉 마코브 모델 기반의 음성인식용 외국어 음향모델로 훈련되는 것인 음향모델 생성 장치
|
3 |
3
제 1 항에 있어서,상기 비원어민 자국어 음향모델은 상기 비원어민의 자국어 발성 음성 DB를 이용하여 GMM 및 HMM 기반의 자국어 음성인식용 음향모델로 훈련되는 것인 음향모델 생성 장치
|
4 |
4
제 1 항에 있어서,상기 기준 외국어 음향모델 및 상기 비원어민 자국어 음향모델은 결정트리 기반 또는 데이터 기반의 상태 공유(state tying) 과정을 통해 생성된 상태 세트(state set)를 포함하는 것인 음향모델 생성 장치
|
5 |
5
제 1 항에 있어서,상기 음향모델 생성부는 상기 제 2 음향모델부의 각 상태 중 두 개의 상태 각각의 로그 우도의 합과, 상기 두 개의 상태가 결합된 로그 우도의 차이가 일정 기준보다 작은 경우에 대응하는 상태를 검색하여 상기 맵핑 관계를 형성하는 것인 음향모델 생성 장치
|
6 |
6
제 1 항에 있어서,상기 제 2 음향모델부의 각 상태 중 두 개의 상태에 대응되는 논리적 트라이폰 집합이 동일한 경우, 상기 두 개의 상태를 클러스터링하는 것인 음향모델 생성 장치
|
7 |
7
제 1 항에 있어서,상기 제 2 음향모델부의 각 상태 중 두 개의 상태의 논리적 트라이폰 집합이 서로 포함 관계에 있고, 다른 상태와 포함 관계에 있는 논리적 트라이폰 집합이 존재하지 않는 경우, 상기 두 상태를 결합하는 것인 음향모델 생성 장치
|