1 |
1
입력되는 음성 데이터에 대하여 제1 언어모델을 이용하여 음성인식을 수행함으로써, 제1 엔베스트 후보리스트를 출력하는 단계;상기 제1 엔베스트 후보리스트 중 어느 하나의 인식 후보를 이용하여 각각의 언어모델 군집에 대한 믹스쳐 웨이트 값을 결정하는 단계; 상기 믹스쳐 웨이트 값에 기반하여 상기 각각의 언어모델 군집을 인터폴레이션하는 단계; 및상기 각각의 언어모델 군집이 인터폴레이션된 결과를 이용하여 상기 제1 엔베스트 후보리스트를 리스코어링하는 단계를 포함하고, 상기 인터폴레이션하는 단계는,상기 믹스쳐 웨이트 값에 기초하여 기설정된 개수의 상위 언어모델 군집을 선택하고, 선택된 상기 언어모델 군집의 구성 언어모델의 정렬 위치에 따라 상기 언어모델 군집 각각에 할당되는 믹스쳐 웨이트 값을 차등적으로 배분하는 것인 언어모델 군집화 기반 음성인식 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 어느 하나의 인식 후보는,상기 제1 엔베스트 후보리스트 중 언어모델과 유사도가 가장 큰 1-best 후보인 것인 언어모델 군집화 기반 음성인식 방법
|
4 |
4
제1항에 있어서, 상기 리스코어링하는 단계는,상기 각각의 언어모델 군집이 인터폴레이션된 결과를 이용하여 상기 제1 엔베스트 후보리스트 각각에 대한 점수를 재평가하고, 재평가된 상기 점수에 따라 상기 제1 엔베스트 후보리스트를 재정렬하는 것인 언어모델 군집화 기반 음성인식 방법
|
5 |
5
제1항에 있어서, 기구축된 대용량 텍스트 코퍼스 DB를 참조하여, 대용량 텍스트 코퍼스에 대한 텍스트 클러스터링을 통해 토픽이 유사한 텍스트를 분할하고, 분할된 상기 텍스트들 각각을 이용하여 토픽 언어 모델을 생성하는 단계; 및생성된 상기 토픽 언어 모델들로 구성된 토픽 언어모델 집합에서 서로 연관있는 토픽언어모델로 구성된 적어도 하나 이상의 부분집합을 생성하여 토픽언어모델 군집을 생성하는 단계;를 더 포함하는 언어모델 군집화 기반 음성인식 방법
|
6 |
6
입력되는 음성 데이터에 대하여 제1 언어모델을 이용하여 음성인식을 수행함으로써, 제1 엔베스트 후보리스트를 출력하는 음성 인식부;상기 제1 엔베스트 후보리스트 중 어느 하나의 인식 후보를 이용하여 각각의 언어모델 군집에 대한 믹스쳐 웨이트 값을 결정하고, 상기 믹스쳐 웨이트 값에 기반하여 상기 각각의 언어모델 군집을 인터폴레이션하는 언어모델 인터폴레이션부; 및상기 각각의 언어모델 군집이 인터폴레이션된 결과를 이용하여 상기 제1 엔베스트 후보리스트를 리스코어링하는 리스코어링부를 포함하고, 상기 언어모델 인터폴레이션부는,상기 믹스쳐 웨이트 값에 기초하여 기설정된 개수의 상위 언어모델 군집을 선택하고, 선택된 상기 언어모델 군집의 구성 언어모델의 정렬 위치에 따라 상기 언어모델 군집 각각에 할당되는 믹스쳐 웨이트 값을 차등적으로 배분하는 것인 언어모델 군집화 기반 음성인식 장치
|
7 |
7
삭제
|
8 |
8
제6항에 있어서, 상기 어느 하나의 인식 후보는,상기 제1 엔베스트 후보리스트 중 언어모델과 유사도가 가장 큰 1-best 후보인 것인 언어모델 군집화 기반 음성인식 장치
|
9 |
9
제6항에 있어서, 상기 리스코어링부는,상기 각각의 언어모델 군집이 인터폴레이션된 결과를 이용하여 상기 제1 엔베스트 후보리스트 각각에 대한 점수를 재평가하고, 재평가된 상기 점수에 따라 상기 제1 엔베스트 후보리스트를 재정렬하는 것인 언어모델 군집화 기반 음성인식 장치
|
10 |
10
제6항에 있어서, 기구축된 대용량 텍스트 코퍼스 DB를 참조하여, 대용량 텍스트 코퍼스에 대한 텍스트 클러스터링을 통해 토픽이 유사한 텍스트를 분할하고, 분할된 상기 텍스트들 각각을 이용하여 토픽 언어 모델을 생성하는 토픽언어모델 생성부; 및생성된 상기 토픽 언어 모델들로 구성된 토픽 언어모델 집합에서 서로 연관있는 토픽언어모델로 구성된 적어도 하나 이상의 부분집합을 생성하여 토픽언어모델 군집을 생성하는 토픽언어모델 군집화부;를 더 포함하는 언어모델 군집화 기반 음성인식 장치
|