1 |
1
수신되는 음성으로부터 특징 벡터를 추출하는 특징 벡터 추출부와, 추출된 특징 벡터를 기반으로 수신된 음성을 단어열로 인식하는 음성 인식부와, 상기 음성 인식부에 의하여 인식된 단어열에 대해서 음소 WFST(Weighted Finite State Transducers)로 변환하는 음소 WFST 변환부와, 상기의 변환된 음소 WFST에 대해서 오류를 보정하는 음성인식 오류 보정부를 포함하고, 상기 음성인식 오류 보정부는, 상기 음소 WFST 변환부로부터 전달되는 음소 WFST를 KL(Kullback-Leibler) 거리행렬에 기반한 발음변이를 모델링하는 WFST 합성부를 포함하고, 상기 KL 거리는, 다음의 수학식 1과 같이 계산되는 음성 인식 오류 보정 장치
|
2 |
2
제 1 항에 있어서, 상기 음성인식 오류 보정부는, 계산된 KL 거리를 이용하여 음소 혼동 행렬을 생성하는 음소 발음변이 모델 생성부를 더 포함하는 음성 인식 오류 보정 장치
|
3 |
3
제 1 항에 있어서, 상기 수학식 1에서 는, 다음의 수학식 2와 같이 계산되는 음성 인식 오류 보정 장치
|
4 |
4
제 1 항에 있어서, 상기 음성 인식부에 의한 수신된 음성의 단어열 분리시에 참조가 되는 음향 모델을 더 포함하고, 상기 음향 모델은 인식 단위의 음소에 대한 상기 특징 벡터의 우도(likelihood) 확률값 정보를 갖는 음성 인식 오류 보정 장치
|
5 |
5
제 1 항에 있어서, 상기 음성 인식부에 의한 수신된 음성의 단어열 인식시에 참조가 되는 발음 사전을 더 포함하고, 상기 발음 사전은 단어의 표준 발음 표기를 인식 단위의 열로 나열되어 있는 정보를 포함하는 음성 인식 오류 보정 장치
|
6 |
6
제 5 항에 있어서, 상기 WFST 합성부는 인식 대상의 단어열을 발음열로 변환한 음소열에 대해서 상기 발음 사전에 존재하는 단어로 다시 변환하는 발음 사전 WFST를 더 포함하는 음성 인식 오류 보정 장치
|
7 |
7
제 1 항에 있어서, 상기 음성 인식부에 의한 수신된 음성의 단어열 분리시에 참조가 되는 언어 모델을 더 포함하고, 상기 언어 모델은 상기의 단어열 분리시에 특정 단어 또는 어절을 제한하기 위한 단어 사이의 연관성 정보를 포함하는 음성 인식 오류 보정 장치
|
8 |
8
제 7 항에 있어서, 상기 WFST 합성부는 상기 연관성 정보가 갖는 확률을 이용하여 상기 단어열을 인식 대상에서 선택적으로 배제하거나 채택하는 언어 모델 WFST를 더 포함하는 음성 인식 오류 보정 장치
|
9 |
9
제 1 항에 있어서, 상기 WFST 합성부로부터 출력되는 합성 WFST에는 상기 발음변이들이 적용되어 재합성된 단어열들로 구성된 경로가 포함되고, 상기 경로들 각각이 갖는 가중치(weight) 또는 확률값을 이용하여 상기의 경로들 중 적어도 하나를 채택하는 최적 경로 도출부를 더 포함하는 음성 인식 오류 보정 장치
|