1 |
1
음성 인식 방법으로서,(1) 잡음이 혼합된 학습 데이터를 이용해 딥 뉴럴 네트워크(Deep Neural Network; DNN)를 학습하는 단계;(2) 테스트 데이터를 상기 학습된 딥 뉴럴 네트워크에 적용하여 보상된 특징 벡터 또는 스테이트 사후 확률을 도출하는 단계; 및(3) 상기 단계 (2)에서 도출된 보상된 특징 벡터 또는 스테이트 사후 확률을 이용해, 음성 인식 결과를 도출하는 단계를 포함하되,상기 단계 (1)은,(1-1) 깨끗한 음성에 잡음을 혼합하여 학습 데이터를 생성하는 단계;(1-2) 상기 학습 데이터로부터 왜곡된 특징 벡터를 추출하고, 상기 추출된 왜곡된 특징 벡터로부터 환경 파라미터를 추출하는 단계; 및(1-3) 상기 왜곡된 특징 벡터 및 환경 파라미터를 이용해 딥 뉴럴 네트워크를 학습하는 단계를 포함하며,상기 단계 (1-3) 이전에는,상기 깨끗한 음성으로부터 특징 벡터를 추출하는 단계를 더 포함하며,상기 단계 (1-3)에서는, 상기 추출된 특징 벡터를 출력으로 하여 상기 딥 뉴럴 네트워크를 학습하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 단계 (1-3) 이전에는,상기 단계 (1-2)에서 추출된 왜곡된 특징 벡터 및 환경 파라미터를 이용해 슈퍼 벡터를 생성하는 단계를 더 포함하며,상기 단계 (1-3)에서는, 상기 슈퍼 벡터를 입력으로 하여 상기 딥 뉴럴 네트워크를 학습하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
|
4 |
4
삭제
|
5 |
5
제1항에 있어서, 상기 단계 (1-3) 이전에는,상기 학습 데이터에 대한 음향 모델의 스테이트 사후확률 값을 도출하는 단계를 더 포함하며,상기 단계 (1-3)에서는, 상기 도출된 학습 데이터에 대한 음향 모델의 스테이트 사후확률 값을 출력으로 하여 상기 딥 뉴럴 네트워크를 학습하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
|
6 |
6
제1항에 있어서, 상기 단계 (2)는,(2-1) 테스트 데이터에서 특징 벡터를 추출하고, 상기 추출된 특징 벡터로부터 환경 파라미터를 추출하는 단계;(2-2) 상기 단계 (2-1)에서 추출된 특징 벡터 및 환경 파라미터를 이용해 슈퍼 벡터를 생성하는 단계; 및(2-3) 상기 생성한 슈퍼 벡터를 상기 단계 (1)에서 학습된 딥 뉴럴 네트워크에 입력 벡터로 적용하여, 보상된 특징 벡터 또는 스테이트 사후 확률을 도출하는 단계를 포함하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
|
7 |
7
제1항에 있어서, 상기 단계 (3)에서는,음향 모델을 기반으로 하는 디코더를 통하여, 음성 인식 결과를 도출하는 것을 특징으로 하는, 딥 뉴럴 네트워크 기반 특징 보상 기법을 이용한 음성 인식 방법
|