1 |
1
입력되는 음성의 잡음 처리 및 음성구간 검출을 수행하여 음성데이터를 출력하는 전처리부와, 상기 음성데이터를 기 학습된 문맥종속 음소모델에 적용하여 음성인식을 수행하고 음성정보를 출력하는 음성인식부와,상기 음성정보를 이용하여 환경요인 파라미터 및 스코어를 추출하는 환경요인 파라미터 추출부와, 기 학습된 문맥독립 반음소 모델, 음소 지속 모델(phone duration model), 우도, Nbest 정보 중 적어도 하나 이상에 적용하여 단어별 신뢰도 측정을 위한 입력 파라미터를 추출하는 입력 파라미터 추출부와,상기 추출되는 입력 파라미터가 여러개인 경우는 기 정의된 분류기의 훈련 모델을 사용하여 신뢰도 측정값을 계산하고, 단일 입력 파라미터인 경우는 추출된 신뢰도 측정값을 그대로 사용하는 신뢰도 측정부와,상기 스코어의 평균값을 통해 산출된 환경요인 값을 적용하여 새로운 임계치값을 계산하고 갱신하는 임계치값 결정부와, 상기 갱신된 임계치값을 사용하여 인식결과의 수락 및 거절을 판단하는 판단부를 포함하고, 상기 환경요인 값은 채널특성인 신호대 잡음 비(SNR: Signal to Noise Ratio)와, 화자특성인 음성 에너지 및 F0 포만트 크기 중 적어도 하나 이상이며,상기 문맥독립 반음소 모델은 모든 믹스처를 사용한 반모델(Allmixture antimodel), 적응 반모델(adapted antimodel), 변별학습을 수행하는 반모델(discriminative antimodel), VQ(Vector Quantization)기반 반모델(VQ based antimodel) 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
(a) 입력된 음성의 잡음 처리 및 음성구간을 검출하는 단계와,(b) 상기 검출된 음성데이터를 기 설정되어 학습된 문맥종속 음소모델에 적용하여 비터비 탐색을 통해 음성인식을 수행하는 단계와,(c) 상기 인식된 음성정보를 기 설정되어 학습된 문맥독립 반음소 모델, 음소 지속 모델(phone duration model), 우도, Nbest 정보 중 적어도 하나 이상에 적용하여 입력 파라미터값과 환경 요인 파라미터를 산출하는 단계와,(d) 상기 산출된 입력 파라미터값을 기반으로 신뢰도 측정값을 계산하고, 정규화하는 단계와,(e) 상기 산출된 환경요인 파라미터에 기반하여 계산된 환경요인 값을 적용하여 새로운 임계치값을 계산하고 갱신하는 단계와,(f) 상기 갱신된 임계치값을 상기 산출된 신뢰도 측정값과 비교하여 음성 인식결과에 따른 수락 또는 거절을 결정하는 단계를 포함하고,상기 환경요인 값은 채널특성인 신호대 잡음 비(SNR: Signal to Noise Ratio)와, 화자특성인 음성 에너지 및 F0 포만트 크기 중 적어도 하나 이상이며,상기 문맥독립 반음소 모델은 모든 믹스처를 사용한 반모델(Allmixture antimodel), 적응 반모델(adapted antimodel), 변별학습을 수행하는 반모델(discriminative antimodel), VQ(Vector Quantization)기반 반모델(VQ based antimodel) 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
|
5 |
5
삭제
|
6 |
6
제 4 항에 있어서, 상기 (d) 단계는 산출된 입력 파라미터가 여러개의 입력 파라미터를 기반하는 경우, 분류기에 필요한 분류기 모델 생성을 위하여 훈련하는 단계와, 상기 훈련 단계에서 산출된 훈련모델을 이용하여 훈련 데이터에 대한 신뢰도 측정값, 평균 및 표준편차를 계산하는 단계와, 상기 계산된 신뢰도 측정값을 정규화하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
|
7 |
7
제 4 항에 있어서, 상기 (d) 단계는 산출된 입력 파라미터가 단일의 입력 파라미터를 기반으로 하는 경우, 훈련 데이터로부터 직접 신뢰도 측정값, 평균 및 표준편차를 계산하여 정규화하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
|
8 |
8
제 4 항에 있어서, 상기 (e) 단계에서 사용할 사전 파라미터 데이터를 구하는 방법은 산출된 입력 파라미터값을 기반으로 분류기 모델을 사용하여 훈련 데이터를 결정하는 단계와, 상기 결정된 훈련 데이터를 사용하여 환경요인 파라미터 값과 입력 데이터로 사용할 파라미터를 산출하는 단계와, 기 정의된 분류기 모델을 이용하여 상기 산출된 입력 파라미터의 신뢰도 측정값, 평균 및 표준편차를 계산하는 단계와, 상기 계산된 신뢰도 측정값을 정규화하는 단계와,상기 계산된 정규화된 신뢰도 측정값과 신호대 잡음비와의 상관계수, 정규화된 신뢰도 측정값과 음성에너지와의 상관계수, 정규회된 F0포만트 크기와의 상관계수를 계산하는 단계를 포함하는 음성인식 방법
|
9 |
9
제 4 항에 있어서, 상기 (e) 단계는 (e1) 훈련 데이터를 사용하여 산출된 환경요인 파라미터를 기반하여 환경요인 특성의 초기값을 계산하고 설정하는 단계와,(e2) 실시간으로 현재 환경요인을 기반한 환경요인 특성에 대한 각각의 현재 스코어를 계산하고 정규화하는 단계와,(e3) 상기 초기화된 환경요인 파라미터 각각의 상관계수를 상기 실시간으로 구해진 환경요인 파라미터 각각의 현재 스코어와 서로 곱하여 새로운 스코어를 산출하는 단계와, (e4) 상기 산출된 새로운 스코어를 모두 합하고 전체 평균값을 계산하여 환경요인 값을 산출하는 단계와, (e5) 상기 산출된 환경요인 값에 특정 적응계수를 곱하고 기존의 임계치값에 더하거나 빼서 새로운 임계치값을 계산하는 단계와,(e6) 상기 계산된 새로운 임계치값으로 기존의 임계치값을 갱신하는 단계를 포함하는 음성인식 방법
|
10 |
10
제 9 항에 있어서, 상기 (e1)의 환경요인 특성의 초기값은 신호대 잡음비와의 초기값, 음성 에너지와의 초기값 및 FO 포만트 크기에 대한 초기값 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
|
11 |
11
제 10 항에 있어서,상기 초기값은 신뢰도 측정값과의 상관계수, 평균, 표준편차 값 중 적어도 하나 이상인 것을 특징으로 하는 음성인식 방법
|
12 |
12
제 9 항에 있어서, 상기 (e3) 단계는 상기 정규화하여 계산된 신호대 잡음비의 현재 스코어와 상기 신호대 잡음비 상관계수를 곱하여 제 1 스코어를 산출하는 단계와,상기 정규화하여 계산된 음성 에너지의 현재 스코어와 상기 음성 에너지 상관계수를 곱하여 제 2 스코어를 산출하는 단계와,상기 정규화하여 계산된 FO 포만트 크기의 현재 스코어와 상기 FO 포만트 크기 상관계수를 곱하여 제 3 스코어를 산출하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
|
13 |
13
제 4 항에 있어서, 상기 (f) 단계는 상기 비교결과 계산된 신뢰도 측정값보다 임계치값이 크면 인식결과를 수락하는 단계와, 상기 비교결과 계산된 신뢰도 측정값이 임계치값보다 작으면 인식 결과를 거절하는 단계와,상기 인식 결과가 수락되면 음성인식 시스템을 동작시키고, 상기 인식 결과가 거절되면 사용자에게 메시지 또는 음성을 통해 음성인식을 위한 재발성을 유도하는 단계를 포함하는 음성인식 방법
|