1 |
1
LPC(Linear Predictive Coding)-10e 보코더에서 DNN을 이용한 유무성음 판별 방법에 있어서,(a) TIMIT 데이터베이스(DB)를 이용하여 딥러닝 훈련을 위한 훈련 기준 설정값인 유/무성음 레이블 정보와, 이에 대한 판별 기준값을 생성하여 입력하는 단계;(b) 미리 정해진 입력 음원에 대하여 음성 특징 추출부를 통해 제 1 음성 특징값을 추출하고, 상기 제 1 음성 특징값과 상기 판별 기준값을 DNN(deep neural network) 모델에 입력하여 가중치(weight)와 바이어스(bias)를 훈련하는 단계;(c) 임의 입력 음원에 대하여 상기 음성 특징 추출부를 통해 제 2 음성 특징값을 추출하고, 상기 DNN(deep neural network) 모델부가 상기 제 2 음성 특징값을 상기 DNN 모델에 입력하여 2개의 출력값을 산출하는 단계; 및 (d) 상기 2개의 출력값을 상기 판별 기준값과 비교하여 상기 임의 입력 음원에 대하여 유성음 또는 무성음으로 판정하는 단계;를 포함하는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
|
2 |
2
제 1 항에 있어서,상기 2개의 출력값이 확률로 표시되는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
|
3 |
3
제 1 항에 있어서,상기 유/무성음 레이블 정보는 TIMIT 데이터베이스의 포님(phoneme) 정보를 포님 코드 테이블(phoneme code table)을 통해 유무성음 레이블링으로 치환하며, 각기 판별 기준값을 부여하여 이를 훈련과 판별의 기준값으로 사용하는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
|
4 |
4
제 1 항에 있어서,상기 음성 특징값은 7개의 음성 특징값으로 이루어지는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
|
5 |
5
제 4 항에 있어서,상기 (b) 단계는,입력 레이어가 전후 부프레임 및 현재 부프레임의 연관성을 고려하여 3개의 부프레임에 해당하는 21개의 음성 특징값을 생성하는 단계;은닉 레이어가 상기 음성 특징값을 이용한 지도 학습(supervised learning)을 수행함으로써 모델 내의 가중치(weight)와 바이어스(bias)를 훈련하는 단계; 를 포함하는 것을 특징으로 하는 DNN을 이용한 유무성음 판별 방법
|
6 |
6
제 4 항에 있어서,상기 2개의 출력값이 확률로 표시되는 것을 특징으로 하는 DNN을 이용한 유무성음 판별 방법
|