맞춤기술찾기

이전대상기술

합성 음성 신호 생성 방법, 뉴럴 보코더 및 뉴럴 보코더의 훈련 방법

  • 기술번호 : KST2020012169
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 스펙트럼 관련 파라미터들 및 여기 관련 파라미터들을 포함하는 복수의 음향 파라미터들을 획득하고, 복수의 음향 파라미터들에 기반하여 여기 신호(excitation signal)를 추정하고, 추정된 여기 신호에 대해 스펙트럼 관련 파라미터들 중 적어도 하나에 기반한 선형 합성 필터를 적용함으로써 타겟 음성 신호를 생성하는 뉴럴 보코더에 의한 음성 신호 생성 방법이 제공된다.
Int. CL G10L 13/02 (2006.01.01) G10L 13/08 (2006.01.01) G10L 19/087 (2013.01.01) G10L 19/06 (2006.01.01) G10L 25/30 (2013.01.01)
CPC G10L 13/02(2013.01) G10L 13/02(2013.01) G10L 13/02(2013.01) G10L 13/02(2013.01) G10L 13/02(2013.01)
출원번호/일자 1020190004085 (2019.01.11)
출원인 네이버 주식회사, 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2020-0092501 (2020.08.04) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.01.11)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 네이버 주식회사 대한민국 경기도 성남시 분당구
2 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 송은우 경기도 성남시 분당구
2 김진섭 경기도 성남시 분당구
3 강홍구 서울특별시 은평구
4 변경근 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.01.11 수리 (Accepted) 1-1-2019-0039159-12
2 의견제출통지서
Notification of reason for refusal
2020.07.22 발송처리완료 (Completion of Transmission) 9-5-2020-0498943-49
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.09.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0992439-57
4 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.09.18 수리 (Accepted) 1-1-2020-0992438-12
5 등록결정서
Decision to grant
2020.10.29 발송처리완료 (Completion of Transmission) 9-5-2020-0750765-64
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
컴퓨터에 의해 구현되는 뉴럴 보코더(neural vocoder)에 의해 수행되는 음성 신호 생성 방법에 있어서, 스펙트럼 관련 파라미터들(spectral parameter) 및 여기(excitation)의 주기성에 따라 구분되는 여기 관련 파라미터들을 포함하는 복수의 음향 파라미터들을 획득하는 단계;상기 복수의 음향 파라미터들에 기반하여 여기 신호(excitation signal)를 추정하는 단계; 및상기 추정된 여기 신호에 대해 상기 스펙트럼 관련 파라미터들 중 적어도 하나에 기반한 선형 합성 필터를 적용함으로써 타겟 음성 신호를 생성하는 단계 를 포함하는, 음성 신호 생성 방법
2 2
제1항에 있어서,상기 여기 관련 파라미터들은 소정의 컷오프 주파수를 이하의 여기를 나타내는 제1 여기 파라미터 및 상기 컷오프 주파수 초과의 여기를 나타내는 제2 여기 파라미터를 포함하는, 음성 신호 생성 방법
3 3
제2항에 있어서,상기 제1 여기 파라미터는 상기 여기의 고조파 스펙트럼(harmonic spectrum)을 나타내고, 상기 제2 여기 파라미터는 상기 여기의 그 외의 부분을 나타내는, 음성 신호 생성 방법
4 4
제1항에 있어서,상기 스펙트럼 관련 파라미터들은, 음성 신호의 피치를 나타내는 주파수 파라미터, 음성 신호의 에너지를 나타내는 에너지 파라미터, 음성 신호의 유성음(voice) 또는 무성음(unvoice) 여부를 나타내는 파라미터 및 음성 신호의 라인 스펙트럼 주파수(Line Spectral Frequency; LSF)를 나타내는 파라미터를 포함하는, 음성 신호 생성 방법
5 5
제4항에 있어서,상기 타겟 음성 신호를 생성하는 단계는, 상기 LSF를 나타내는 파라미터를 선형 예측 코딩(Linear Predictive Coding; LPC)으로 변환하는 단계; 및상기 추정된 여기 신호에 대해 상기 변환된 LPC에 기반한 상기 선형 합성 필터를 적용하는 단계를 포함하는, 음성 신호 생성 방법
6 6
제1항에 있어서,상기 복수의 음향 파라미터들은 입력된 텍스트 또는 입력된 음성 신호에 기반하여 음향 모델(acoustic model)에 의해 생성된 것인, 음성 신호 생성 방법
7 7
제1항에 있어서,상기 뉴럴 보코더는 훈련을 위해 입력된 음성 신호에 기반하여 훈련된 것이고, 상기 훈련은,상기 입력된 음성 신호에 대해 선형 예측 분석 필터(Linear prediction analysis filter)를 적용함으로써 상기 입력된 음성 신호로부터 여기 신호를 분리하는 단계; 및상기 분리된 여기 신호의 확률 분포를 모델링하는 단계를 포함하고, 상기 여기 신호를 추정하는 단계는,상기 모델링된 여기 신호의 확률 분포를 사용하여, 상기 복수의 음향 파라미터들에 대한 여기 신호를 추정하는, 음성 신호 생성 방법
8 8
제7항에 있어서,상기 여기 신호를 분리하는 단계는, 상기 입력된 음성 신호의 LSF를 나타내는 파라미터를 선형 예측 코딩(Linear Predictive Coding; LPC)으로 변환하는 단계; 및상기 입력된 음성 신호에 대해 상기 입력된 음성 신호의 변환된 LPC에 기반한 상기 선형 예측 분석 필터를 적용하는 단계를 포함하는, 음성 신호 생성 방법
9 9
제7항에 있어서,상기 분리된 여기 신호는 상기 입력된 음성 신호에 대한 잔차 성분(residual component)인, 음성 신호 생성 방법
10 10
컴퓨터에 의해 구현되는 뉴럴 보코더의 훈련 방법에 있어서, 음성 신호를 입력 받는 단계;상기 입력된 음성 신호로부터 스펙트럼 관련 파라미터들 및 여기의 주기성에 따라 구분되는 여기 관련 파라미터들을 포함하는 복수의 음향 파라미터들을 추출하는 단계;상기 입력된 음성 신호에 대해 상기 스펙트럼 관련 파라미터들 중 적어도 하나에 기반한 선형 예측 분석 필터를 적용함으로써 상기 입력된 음성 신호로부터 여기 신호를 분리하는 단계; 및상기 분리된 여기 신호의 확률 분포를 모델링하는 단계를 포함하는, 뉴럴 보코더의 훈련 방법
11 11
제10항에 있어서,상기 여기 신호를 분리하는 단계는, 상기 스펙트럼 관련 파라미터들 중 상기 입력된 음성 신호의 LSF를 나타내는 파라미터를 LPC로 변환하는 단계; 및상기 입력된 음성 신호에 대해 상기 입력된 음성 신호의 변환된 LPC에 기반한 상기 선형 예측 분석 필터를 적용하는 단계를 포함하는, 뉴럴 보코더의 훈련 방법
12 12
제10항에 있어서,상기 여기 관련 파라미터들은 소정의 컷오프 주파수를 이하의 여기를 나타내는 제1 여기 파라미터 및 상기 컷오프 주파수 초과의 여기를 나타내는 제2 여기 파라미터를 포함하는, 뉴럴 보코더의 훈련 방법
13 13
제1항 내지 제12항 중 어느 한 항의 방법을 컴퓨터에 실행시키기 위한 프로그램이 기록되어 있는 비-일시적인 컴퓨터 판독가능한 기록 매체
14 14
뉴럴 보코더에 있어서,스펙트럼 관련 파라미터들(spectral parameter) 및 여기(excitation)의 주기성에 따라 구분되는 여기 관련 파라미터들을 포함하는 복수의 음향 파라미터들을 획득하는 파라미터 획득부;상기 복수의 음향 파라미터들에 기반하여 여기 신호(excitation signal)를 추정하는 여기 신호 추정부; 및상기 추정된 여기 신호에 대해 상기 스펙트럼 관련 파라미터들 중 적어도 하나에 기반한 선형 합성 필터를 적용함으로써 타겟 음성 신호를 생성하는 음성 신호 생성부 를 포함하는, 뉴럴 보코더
15 15
제14항에 있어서,상기 음성 신호 생성부는 상기 스펙트럼 관련 파라미터들 중 음성 신호의 LSF를 나타내는 파라미터를 선형 예측 코딩(Linear Predictive Coding; LPC)으로 변환하는 변환부를 포함하고, 상기 추정된 여기 신호에 대해 상기 변환된 LPC에 기반한 상기 선형 합성 필터를 적용하는, 뉴럴 보코더
16 16
제14항에 있어서,상기 뉴럴 보코더는 훈련을 위해 입력된 음성 신호에 기반하여 훈련된 것이고, 상기 입력된 음성 신호에 대해 선형 예측 분석 필터(linear prediction analysis filter)를 적용함으로써 상기 입력된 음성 신호로부터 여기 신호를 분리하는 여기 신호 분리부; 및상기 분리된 여기 신호의 확률 분포를 모델링하는 모델링부를 더 포함하고, 상기 여기 신호 추정부는, 상기 모델링된 여기 신호의 확률 분포를 사용하여, 상기 복수의 음향 파라미터들에 대한 여기 신호를 추정하는, 뉴럴 보코더
17 17
제16항에 있어서, 상기 여기 신호 분리부는 상기 입력된 음성 신호의 LSF를 나타내는 파라미터를 선형 예측 코딩(Linear Predictive Coding; LPC)으로 변환하는 변환부를 포함하고, 상기 입력된 음성 신호에 대해 상기 입력된 음성 신호의 변환된 LPC에 기반한 상기 선형 예측 분석 필터를 적용하는, 뉴럴 보코더
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.