1 |
1
음성인식 시스템을 이용한 음성인식 서비스 방법에 있어서, 훈련용 음성신호 집합으로부터 탐색에 사용할 음향 모델을 훈련하고, 발화검증에 사용할 반음소 모델을 훈련하는 제 100 단계; 서비스 환경과 유사한 환경에서 음성 신호를 수집하여 개발용 음성 신호 집합을 구축하는 제 200 단계; 구축된 개발용 음성 신호 집합에 대해 음성인식을 수행하는 제 310 단계, 상기 음성인식 결과를 음성 신호 정답 목록과 비교하여 정인식인지, 아니면 오인식인지의 여부를 판단하는 제 320 단계, 상기 제 320 단계에서 정인식이면 다시 상기 제 310 단계로 진행하는 한편, 오인식이면 그 음성인식 결과 중 오류 음소 구간을 찾아 적응에 필요한 관측 정보를 누적하는 제 330 단계, 누적 과정이 적응에 사용할 모든 음성 신호에 대해서 수행되었는지 확인하여, 모든 음성신호에 대한 누적이 완료되었는지의 여부를 판단하는 제 340 단계 및 상기 제 340 단계에서 누적이 완료되지 않으면 다시 상기 제 310 단계로 진행하는 한편, 완료되면 누적된 관측 정보를 사용하여 맵(MAP) 방법에 의한 반음소 모델 적응을 수행하는 제 350 단계로 이루어지고, 상기 개발용 음성 신호 집합과 상기 훈련용 음성신호 집합으로 훈련된 반음소 모델을 사용하여 반음소 모델을 적응시키는 제 300 단계; 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 400 단계; 실제 음성인식 서비스를 통해 사용된 음성신호를 수집하여 실제 서비스 음성 신호 집합을 구축하는 제 500 단계; 구축된 실제 서비스 음성 신호 집합에 대해 음성인식을 수행하는 제 610 단계, 상기 음성인식 결과를 음성 신호 정답 목록과 비교하여 정인식인지, 아니면 오인식인지의 여부를 판단하는 제 620 단계, 상기 제 620 단계에서 정인식이면 다시 상기 제 610 단계로 진행하는 한편, 오인식이면 그 음성인식 결과 중 오류 음소 구간을 찾아 적응에 필요한 관측 정보를 누적하는 제 630 단계, 누적 과정이 적응에 사용할 모든 음성 신호에 대해서 수행되었는지 확인하여, 모든 음성신호에 대한 누적이 완료되었는지의 여부를 판단하는 제 640 단계 및 상기 제 640 단계에서 누적이 완료되지 않으면 다시 상기 제 610 단계로 진행하는 한편, 완료되면 누적된 관측 정보를 사용하여 맵(MAP) 방법에 의한 반음소 모델 적응을 수행하는 제 650 단계로 이루어지고, 상기 실제 서비스 음성신호 집합을 사용하여 반음소 모델을 적응시키는 제 600 단계; 및 새로운 실제 서비스 환경에 적응된 반음소 모델을 사용하여 실제 음성인식 서비스를 수행하는 제 700 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
2 |
2
삭제
|
3 |
3
제 1항에 있어서, 상기 제 350 단계의 맵(MAP) 방법은, 하기의 [수학식 2]를 이용하여 반음소 모델을 적응하는 방식인 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
4 |
4
제 1항에 있어서, 상기 제 400 단계는, 음성 신호가 입력되면 끝점 검출을 수행한 후 음성인식에 유용한 특징 벡터를 추출하는 제 410 단계; 상기 추출된 특징 벡터에 대해 인식대상 어휘로 구성된 탐색공간에서 가장 유사한 어휘를 탐색하는 제 420 단계; 및 상기 탐색 과정을 통해 전달된 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받아 적응 반음소 모델을 통해 발화검증을 수행하는 제 430 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
5 |
5
제 4항에 있어서, 상기 제 430 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 431 단계; 적응 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 432 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 433 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 434 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 435 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
6 |
6
삭제
|
7 |
7
제 1항에 있어서, 상기 제 650 단계의 맵(MAP) 방법은, 하기의 [수학식 2]를 이용하여 반음소 모델을 적응하는 방식인 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
8 |
8
제 1항에 있어서, 상기 제 700 단계는, 음성 신호가 입력되면 끝점 검출을 수행한 후 음성인식에 유용한 특징 벡터를 추출하는 제 710 단계; 상기 추출된 특징 벡터에 대해 인식대상 어휘로 구성된 탐색공간에서 가장 유사한 어휘를 탐색하는 제 720 단계; 및 상기 탐색 과정을 통해 전달된 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받아, 새로운 실제 서비스 환경에 적응된 반음소 모델을 사용하여 발화검증을 수행하는 제 730 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
9 |
9
제 8항에 있어서, 상기 제 730 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 731 단계; 새로운 실제 서비스 환경에 적응된 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 732 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 733 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 734 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 735 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|
10 |
9
제 8항에 있어서, 상기 제 730 단계는, 상기 탐색 과정을 통해 인식 결과 어휘와 해당 어휘를 구성하는 음소들의 유사도값을 전달받는 제 731 단계; 새로운 실제 서비스 환경에 적응된 반음소 모델에 대한 인식 결과 어휘의 유사도를 계산하는 제 732 단계; 인식 결과 어휘의 탐색에 사용된 문맥종속(CD) 음향모델에 대한 유사도와 적응 반음소 모델에 대한 유사도의 로그-유사도 비율을 계산하는 제 733 단계; 발화검증 과정의 신뢰도인 로그-유사도 비율(LLR)을 임계값과 비교하여 LLR값이 임계값보다 크면 인식 결과를 수락하는 한편, LLR값이 임계값보다 작으면 인식 결과를 거절하는 제 734 단계; 및 상기 발화검증의 수락 또는 거절 결과에 따라 인식 결과 어휘를 출력하거나, 또는 사용자에게 재발성을 요구하는 제 735 단계로 이루어진 것을 특징으로 하는 적응 반음소 모델을 이용한 음성인식 서비스 방법
|