맞춤기술찾기

이전대상기술

LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법

  • 기술번호 : KST2019028624
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 보코더의 음질 개선 기술에 관한 것으로서, 더 상세하게는 음원의 프레임별로 레이블된 유성음과 무성음의 기계 학습을 이용한 보다 정확한 유무성음 판별을 통해 합성 음원의 왜곡을 감쇄하는 유무성음 판별 방법에 대한 것이다.본 발명에 따르면, 정확히 판별된 유무성음을 통해 합성된 음성의 경우, 합성 소음이 크게 감소하여, 합성 음성에서 보다 높은 음질을 달성할 수 있다.
Int. CL G10L 25/93 (2013.01.01) G10L 25/30 (2013.01.01) G10L 15/02 (2006.01.01) G10L 19/00 (2006.01.01)
CPC G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01)
출원번호/일자 1020170021568 (2017.02.17)
출원인 국방과학연구소
등록번호/일자 10-1862982-0000 (2018.05.24)
공개번호/일자
공고번호/일자 (20180530) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.02.17)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김홍국 대한민국 광주광역시 광산구
2 이정혁 대한민국 광주광역시 북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 한양특허법인 대한민국 서울특별시 강남구 논현로**길 **, 한양빌딩 (도곡동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.02.17 수리 (Accepted) 1-1-2017-0165870-54
2 의견제출통지서
Notification of reason for refusal
2018.02.14 발송처리완료 (Completion of Transmission) 9-5-2018-0113983-33
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.03.13 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0250540-10
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.03.13 수리 (Accepted) 1-1-2018-0250541-55
5 등록결정서
Decision to grant
2018.05.21 발송처리완료 (Completion of Transmission) 9-5-2018-0345134-27
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
LPC(Linear Predictive Coding)-10e 보코더에서 DNN을 이용한 유무성음 판별 방법에 있어서,(a) TIMIT 데이터베이스(DB)를 이용하여 딥러닝 훈련을 위한 훈련 기준 설정값인 유/무성음 레이블 정보와, 이에 대한 판별 기준값을 생성하여 입력하는 단계;(b) 미리 정해진 입력 음원에 대하여 음성 특징 추출부를 통해 제 1 음성 특징값을 추출하고, 상기 제 1 음성 특징값과 상기 판별 기준값을 DNN(deep neural network) 모델에 입력하여 가중치(weight)와 바이어스(bias)를 훈련하는 단계;(c) 임의 입력 음원에 대하여 상기 음성 특징 추출부를 통해 제 2 음성 특징값을 추출하고, 상기 DNN(deep neural network) 모델부가 상기 제 2 음성 특징값을 상기 DNN 모델에 입력하여 2개의 출력값을 산출하는 단계; 및 (d) 상기 2개의 출력값을 상기 판별 기준값과 비교하여 상기 임의 입력 음원에 대하여 유성음 또는 무성음으로 판정하는 단계;를 포함하는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
2 2
제 1 항에 있어서,상기 2개의 출력값이 확률로 표시되는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
3 3
제 1 항에 있어서,상기 유/무성음 레이블 정보는 TIMIT 데이터베이스의 포님(phoneme) 정보를 포님 코드 테이블(phoneme code table)을 통해 유무성음 레이블링으로 치환하며, 각기 판별 기준값을 부여하여 이를 훈련과 판별의 기준값으로 사용하는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
4 4
제 1 항에 있어서,상기 음성 특징값은 7개의 음성 특징값으로 이루어지는 것을 특징으로 하는 LPC-10e 보코더에서 DNN을 이용한 유무성음 판별 방법
5 5
제 4 항에 있어서,상기 (b) 단계는,입력 레이어가 전후 부프레임 및 현재 부프레임의 연관성을 고려하여 3개의 부프레임에 해당하는 21개의 음성 특징값을 생성하는 단계;은닉 레이어가 상기 음성 특징값을 이용한 지도 학습(supervised learning)을 수행함으로써 모델 내의 가중치(weight)와 바이어스(bias)를 훈련하는 단계; 를 포함하는 것을 특징으로 하는 DNN을 이용한 유무성음 판별 방법
6 6
제 4 항에 있어서,상기 2개의 출력값이 확률로 표시되는 것을 특징으로 하는 DNN을 이용한 유무성음 판별 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.