1 |
1
삭제
|
2 |
2
음성 신호를 입력 받는 단계;상기 입력된 음성 신호의 특징을 추출하는 단계;상기 추출된 특징에 대해 심층 신경망 기반의 다중 디코딩을 수행하여 문맥 종속 음성 인식 결과를 출력하는 단계; 및상기 문맥 종속 음성 인식 결과를 이용하여 음성 신호의 수락 여부를 결정하는 단계를 포함하고,상기 문맥 종속 음성 인식 결과를 출력하는 단계는,문맥 종속 로그 확률값 및 문맥 독립 로그 확률값 중 적어도 하나를 산출하는 단계를 포함하고,상기 음성 신호의 수락 여부를 결정하는 단계는 반모델(antimodel) 스코어에 기초하여 이루어지고,상기 반모델 스코어는 제1 반모델 스코어 및 제2 반모델 스코어를 포함하고,상기 제1 반모델 스코어는 문맥 종속 반 음소 레벨 로그 확률값이고,상기 제2 반모델 스코어는 문맥 독립 반 음소 레벨 로그 확률값이고,상기 문맥 종속 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열 이외의 음소열들의 로그 확률값을 합하고, 상기 합한 확률 값을 프레임 수로 나눔으로써 획득되는 발화검증 방법
|
3 |
3
제2항에 있어서,상기 다중 디코딩은,심층신경망 기반으로 훈련된 음향 모델, n-gram 언어모델 및 문맥 독립 음향 모델 중 적어도 하나를 이용하여 수행되는 발화검증 방법
|
4 |
4
제2항에 있어서,상기 반모델 스코어는 상기 출력된 문맥 종속 음성 인식 결과를 이용하여 계산되는 발화검증 방법
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
제2항에 있어서,상기 문맥 독립 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열의 가운데 음소를 기준으로, 현재 문맥 독립 음소를 제외한 나머지 음소에 대한 로그 합률값을 합하고, 상기 합한 확률값을 프레임 수로 나눔으로서 획득되는 발화검증 방법
|
8 |
8
제2항에 있어서,상기 음성 신호의 수락 여부를 결정하는 단계는,상기 제1 반모델 스코어를 이용하여 문맥종속 기반 신뢰도를 계산하는 단계;상기 제2 반모델 스코어를 이용하여 문맥독립 기반 신뢰도를 계산하는 단계; 및상기 계산된 문맥종속 기반 신뢰도 및 문맥독립 기반 신뢰도를 이용하여 상기 음성 신호의 수락 여부를 결정하는 단계를 포함하는 발화검증 방법
|
9 |
9
제8항에 있어서,상기 문맥종속 기반 신뢰도는 음성 신호의 부존재와 관련된 H0 모델로서 문맥종속 모델을 이용하고, 음성 신호의 존재와 관련된 H1 모델로서 문맥종속 반 음소 모델을 이용함으로써 획득되고,상기 문맥독립 기반 신뢰도는 상기 H0 모델로서 문맥종속 모델을 이용하고, 상기 H1 모델로서 문맥독립 반 음소 모델을 이용함으로써 획득되는 발화검증 방법
|
10 |
10
입력된 음성 신호로부터 상기 음성 신호의 특징을 추출하는 특징 추출부;상기 추출된 특징에 대해 심층 신경망 기반의 다중 디코딩을 수행하여 문맥 종속 음성 인식 결과를 출력하는 디코딩부; 및상기 문맥 종속 음성 인식 결과를 이용하여 음성 신호의 수락 여부를 결정하는 발화 검증부를 포함하고,상기 디코딩부는,문맥 종속 로그 확률값 및 문맥 독립 로그 확률값 중 적어도 하나를 산출하고,상기 발화 검증부는,반모델(antimodel) 스코어에 기초하여 상기 음성 신호의 수락 여부를 결정하고,상기 반모델 스코어는 제1 반모델 스코어 및 제2 반모델 스코어를 포함하고,상기 제1 반모델 스코어는 문맥 종속 반 음소 레벨 로그 확률값이고,상기 제2 반모델 스코어는 문맥 독립 반 음소 레벨 로그 확률값이고,상기 문맥 종속 반 음소 레벨 로그 확률값은,상기 문맥 종속 음성 인식 결과 중 현재 음소열 이외의 음소열들의 로그 확률값을 합하고, 상기 합한 확률값을 프레임 수로 나눔으로써 획득되는 발화검증 장치
|
11 |
11
제10항에 있어서,상기 다중 디코딩은,심층신경망 기반으로 훈련된 음향 모델, n-gram 언어모델 및 문맥 독립 음향 모델 중 적어도 하나를 이용하여 수행되는 발화검증 장치
|