1 |
1
미리 정해진 문장을 발성하는 화자의 발성음으로부터 화자적응에 사용할 음성의 특징벡터를 추출하기 위한 음성벡터 추출단계; 추출된 음성 특징 벡터로부터 Viterbi 디코딩을 수행하여 시간정열 정보를 구하는 화자음성 디코딩단계; Viterbi 디코딩 결과로 구해지는 시간정열 정보를 이용하여 EigenVoice 화자적응을 수행하기 위한 관측 데이터로서 누적하는 관측정보 누적단계; 누적된 관측 정보와 미리 훈련한 EingeVoice들을 통해 해당 화자에 가까운 음향모델을 생성할 수 있도록 EigenVoice 화자적응 방법에 의해 EigneVoice 계수를 예측하는 EigenVoice 계수 예측단계; 및 상기 EigenVoice 계수 예측단계에서 예측된 EigenVoice 계수를 화자등록 DB에 화자ID 별로 EigenVoice 계수를 등록하는 화자 EigenVoice 계수 등록단계; 를 포함하는 것을 특징으로 하는 EigenVoice 화자적응을 이용한 화자등록 방법
|
2 |
2
청구항 1의 EigenVoice 화자등록 방법에 의해 등록된 화자 EigenVoice 계수를 이용한 화자종속 음성인식 시스템에 있어서, 화자의 Call ID 및 화자의 EigenVoice 계수가 등록된 화자등록 모듈; 화자 ID가 입력될 경우 상기 화자등록 모듈에 등록된 등록화자의 EigenVoice 계수와 EigenVoice(고유음성) 들을 이용하여 화자적응 음향모델을 생성하는 화자종속 음향모델 생성모듈; 입력된 화자음성신호로부터 음성의 특징부분을 추출하는 음성특징 추출모듈; 및 상기 음성특징 추출모듈에서 추출된 음성특징과 상기 화자종속 음향 모델 생성모듈에서 생성된 화자종속 음향모델을 이용하여 인식대상 어휘로 구성된 탐색공간을 탐색하여 등록화자의 최종 음성 인식결과를 출력하는 탐색모듈; 을 포함하는 것을 특징으로 하는 EigenVoice 계수를 이용한 화자종속 음성인식 시스템
|
3 |
3
제 1항에 있어서, 상기 화자등록 모듈은, 화자의 발성음으로부터 화자적응에 사용할 음성의 특징벡터를 추출하기 위한 음성벡터 추출부; 추출된 음성신호의 특징벡터로부터 시간정렬정보를 찾기 위한 Viterbi 디코딩을 수행하는 화자음성 디코딩부; Viterbi 디코딩된 시간정렬 정보를 이용하여 EigenVoice 화자적응을 수행하기 위한 관측 정보로 누적하는 관측정보 누적부; 상기 관측정보 누적부에서 누적된 관측 정보와 미리 훈련한 EingeVoice들을 통해 해당 화자에 가까운 음향모델을 생성하기 위해 EigenVoice 화자적응 방법을 사용하여 EigneVoice 계수를 예측하는 EigenVoice 계수 예측부; 및 상기 EigenVoice 계수 예측부에서 예측된 EigenVoice 계수를 화자등록 DB에 화자ID 별로 EigenVoice 계수를 등록하는 화자 EigenVoice 계수 등록부;로 이루어진 것을 특징으로 하는 EigenVoice 계수를 이용한 화자종속 음성인식 시스템
|
4 |
4
청구항 2의 EigenVoice 계수를 이용한 화자종속 음성인식 시스템을 이용한 화자종속 음성 인식방법에 있어서, 입력된 화자 ID로부터 해당 화자의 등록된 EigenVoice 계수값을 읽어들여 화자종속 음향모델을 생성하는 제 1단계; 및 상기 생성된 화자종속 음향모델을 이용하여 화자의 음성신호로부터 추출된 음성특징을 인식대상 어휘로 구성된 탐색공간을 탐색하여 등록화자의 최종 음성인식을 수행하는 제 2단계; 를 포함하는 것을 특징으로 하는 EigenVoice 계수를 이용한 화자종속 음성인식 방법
|
5 |
5
제 4항에 있어서, 상기 제 1단계는, 음성인식 서비스를 위해 연결한 화자의 화자 ID 또는 call ID 정보로부터 해당 화자를 검색하는 단계; 화자 ID를 이용하여 화자등록 DB에서 해당 화자의 EigenVoice 계수값을 읽어들이는 단계; 읽어들인 해당 화자의 EigenVoice 계수값과 EigenVoice들을 이용하여, EigenVoice 화자적응 방법에 의해 화자종속 음향모델을 생성하는 단계;를 수행하는 것을 특징으로 하는 EigenVoice 계수를 이용한 화자종속 음성인식 방법
|
6 |
5
제 4항에 있어서, 상기 제 1단계는, 음성인식 서비스를 위해 연결한 화자의 화자 ID 또는 call ID 정보로부터 해당 화자를 검색하는 단계; 화자 ID를 이용하여 화자등록 DB에서 해당 화자의 EigenVoice 계수값을 읽어들이는 단계; 읽어들인 해당 화자의 EigenVoice 계수값과 EigenVoice들을 이용하여, EigenVoice 화자적응 방법에 의해 화자종속 음향모델을 생성하는 단계;를 수행하는 것을 특징으로 하는 EigenVoice 계수를 이용한 화자종속 음성인식 방법
|