1 |
1
화자의 음성이 입력되는 음성 입력부;복수의 화자의 음성 데이터가 등록된 화자모델을 구비하며, 상기 음성 입력부로 입력된 음성 데이터와 상기 화자모델에 등록된 복수 화자의 음성 데이터를 비교하여 화자모델 유사도를 산출하는 화자인식 처리부;음성인식 언어모델을 이용하여 상기 음성 입력부로 입력된 음성 데이터를 텍스트로 변환하는 음성인식 처리부;상기 복수의 화자의 음성 데이터를 기반으로 구축된 텍스트 형식의 화자종속 언어모델을 구비하며, 상기 변환된 텍스트와 상기 화자종속 언어모델에 등록된 텍스트를 비교하여 언어모델 유사도를 산출하는 화자종속 언어모델 처리부;상기 화자모델 유사도와 상기 언어모델 유사도를 결합하여 결합 유사도를 산출하고, 산출된 결합 유사도를 기반으로 화자를 인식하는 화자인식 결과 처리부를 포함하며,상기 음성 입력부로 입력되는 음성의 입력 시간에 따라 상기 화자모델 유사도와 상기 언어모델 유사도에 각각 다른 가중치를 적용하여 상기 결합 유사도를 산출하되,상기 결합 유사도는 하기 식 (1)에 의해 산출되며,식 (1) : (여기서, Sfusion은 결합 유사도, Sspeaker는 화자 모델 유사도, Slanguage는 언어 모델 유사도, Wduration은 화자모델 유사도의 가중치, (1-Wduration)은 언어모델 유사도의 가중치임)상기 결합 유사도는, 상기 음성 입력부로 입력되는 음성의 입력 시간이 제1 기준치 이상이면, 상기 화자모델 유사도에 최대 가중치를 적용하는 것을 특징으로 하는 화자종속 언어모델을 이용한 화자인식 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
청구항 1에 있어서, 상기 결합 유사도는, 상기 음성 입력부로 입력되는 음성의 입력 시간이 상기 제1 기준치 보다 작은 제2 기준치 이하이면, 상기 화자모델 유사도에 최소 가중치를 적용하는 화자종속 언어모델을 이용한 화자인식 장치
|
6 |
6
청구항 1 또는 청구항 5에 있어서,상기 화자모델 유사도의 가중치(Wduration)는 하기 식 (2)에 의해 산출되는 화자종속 언어모델을 이용한 화자인식 장치
|
7 |
7
청구항 1에 있어서,상기 화자인식 결과 처리부에 의해 생긴 화자 인식 결과를 상기 화자종속 언어모델의 학습 데이터로 활용하여 상기 화자종속 언어모델을 학습 및 업데이트시키는 화자종속 언어모델 학습부를 더 포함하는 화자종속 언어모델을 이용한 화자인식 장치
|
8 |
8
청구항 1에 있어서,유무선 통신 상에서 화자가 사용하는 텍스트가 반영된 부가 정보를 수집하고, 수집된 부가 정보를 상기 화자종속 언어모델의 학습 데이터로 활용하여 상기 화자종속 언어모델을 학습 및 업데이트시키는 화자종속 언어모델 학습부를 더 포함하는 화자종속 언어모델을 이용한 화자인식 장치
|
9 |
9
화자의 음성이 입력되는 음성입력 단계;상기 입력된 음성의 음성 데이터와 화자모델에 등록된 복수 화자의 음성 데이터를 비교하여 화자모델 유사도를 산출하는 화자인식 처리 단계;음성인식 언어모델을 이용하여 상기 입력된 음성의 음성 데이터를 텍스트로 변환하는 음성인식 처리 단계;화자종속 언어모델을 이용하여 상기 변환된 텍스트와 상기 화자종속 언어모델에 등록된 텍스트를 비교하여 언어모델 유사도를 산출하는 화자종속 언어모델 처리 단계;상기 화자모델 유사도와 상기 언어모델 유사도를 결합하여 결합 유사도를 산출하고, 산출된 결합 유사도를 기반으로 화자를 인식하는 화자인식 결과 처리 단계를 포함하며,상기 음성입력 단계에서 입력된 음성의 입력 시간에 따라 상기 화자모델 유사도와 상기 언어모델 유사도에 각각 다른 가중치를 적용하여 상기 결합 유사도를 산출하되,상기 결합 유사도는 하기 식 (1)에 의해 산출되며,식 (1) : (여기서, Sfusion은 결합 유사도, Sspeaker는 화자 모델 유사도, Slanguage는 언어 모델 유사도, Wduration은 화자모델 유사도의 가중치, (1-Wduration)은 언어모델 유사도의 가중치임)상기 결합 유사도는, 음성 입력부로 입력되는 음성의 입력 시간이 제1 기준치 이상이면, 상기 화자모델 유사도에 최대 가중치를 적용하는 것을 특징으로 하는 화자종속 언어모델을 이용한 화자인식 방법
|
10 |
10
청구항 9에 있어서, 상기 결합 유사도는, 상기 음성 입력부로 입력되는 음성의 입력 시간이 상기 제1 기준치 보다 작은 제2 기준치 이하이면, 상기 화자모델 유사도에 최소 가중치를 적용하는 화자종속 언어모델을 이용한 화자인식 방법
|
11 |
11
청구항 9 또는 청구항 10에 있어서,상기 화자모델 유사도의 가중치(Wduration)는 하기 식 (2)에 의해 산출되는 화자종속 언어모델을 이용한 화자인식 방법
|
12 |
12
청구항 9에 있어서,상기 화자인식 결과 처리 단계에 의해 생긴 화자 인식 결과를 상기 화자종속 언어모델의 학습 데이터로 활용하여 상기 화자종속 언어모델을 학습 및 업데이트시키는 화자종속 언어모델 학습 단계를 더 포함하는 화자종속 언어모델을 이용한 화자인식 방법
|
13 |
13
청구항 9에 있어서,유무선 통신 상에서 화자가 사용하는 텍스트가 반영된 부가 정보를 수집하고, 수집된 부가 정보를 상기 화자종속 언어모델의 학습 데이터로 활용하여 상기 화자종속 언어모델을 학습 및 업데이트시키는 화자종속 언어모델 학습 단계를 더 포함하는 화자종속 언어모델을 이용한 화자인식 방법
|
14 |
14
컴퓨터에 의해 실행되며,화자의 음성이 입력되는 음성입력 단계;상기 입력된 음성의 음성 데이터와 화자모델에 등록된 복수 화자의 음성 데이터를 비교하여 화자모델 유사도를 산출하는 화자인식 처리 단계;음성인식 언어모델을 이용하여 상기 입력된 음성의 음성 데이터를 텍스트로 변환하는 음성인식 처리 단계;화자종속 언어모델을 이용하여 상기 변환된 텍스트와 상기 화자종속 언어모델에 등록된 텍스트를 비교하여 언어모델 유사도를 산출하는 화자종속 언어모델 처리 단계;상기 화자모델 유사도와 상기 언어모델 유사도를 결합하여 결합 유사도를 산출하고, 산출된 결합 유사도를 기반으로 화자를 인식하는 화자인식 결과 처리 단계를 포함하며,상기 음성입력 단계에서 입력된 음성의 입력 시간에 따라 상기 화자모델 유사도와 상기 언어모델 유사도에 각각 다른 가중치를 적용하여 상기 결합 유사도를 산출하되,상기 결합 유사도는 하기 식 (1)에 의해 산출되며,식 (1) : (여기서, Sfusion은 결합 유사도, Sspeaker는 화자 모델 유사도, Slanguage는 언어 모델 유사도, Wduration은 화자모델 유사도의 가중치, (1-Wduration)은 언어모델 유사도의 가중치임)상기 결합 유사도는, 음성 입력부로 입력되는 음성의 입력 시간이 제1 기준치 이상이면, 상기 화자모델 유사도에 최대 가중치를 적용하는 것을 실행시키기 위한 프로그램을 기록한 컴퓨터 해독 가능한 기록 매체
|
15 |
15
청구항 14에 있어서,상기 화자모델 유사도의 가중치(Wduration)는 하기 식 (2)에 의해 산출되는, 컴퓨터 해독 가능한 기록 매체
|