맞춤기술찾기

이전대상기술

다중 화자 데이터를 이용한 딥러닝 기반 음성 합성 장치 및 방법

  • 기술번호 : KST2019000112
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 음성 신호 훈련 방법 및 장치가 개시된다. 본 개시의 일 실시 예에 따른 음성 신호 훈련 장치는 목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와, 다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와, 상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 선택 화자 음성 신호를 추출하고, 상기 선택 화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와, 상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부를 포함할 수 있다.
Int. CL G10L 13/02 (2006.01.01) G10L 13/08 (2006.01.01) G10L 17/02 (2013.01.01) G10L 17/04 (2013.01.01) G10L 17/18 (2013.01.01) G10L 25/03 (2013.01.01)
CPC
출원번호/일자 1020180081395 (2018.07.13)
출원인 한국전자통신연구원, 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2019-0008137 (2019.01.23) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020170088994   |   2017.07.13
대한민국  |   1020170147101   |   2017.11.07
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장인선 대전광역시 유성구
2 강홍구 서울특별시 서대문구
3 강현주 서울특별시 서대문구
4 주영선 서울특별시 서대문구
5 안충현 대전광역시 유성구
6 서정일 대전광역시 유성구
7 양승준 대전광역시 유성구
8 최지훈 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 성병기 대한민국 서울특별시 서초구 사임당로 **, **층 (서초동, 재우빌딩)(마루특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.07.13 수리 (Accepted) 1-1-2018-0690570-77
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 신호 훈련 장치에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와,상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 유사화자 음성 신호를 추출하고, 상기 유사화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
2 2
제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호와의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
3 3
제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호와 상기 다중 화자의 음성 신호와의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 결정하는 유사화자 음성 신호 결정부와,상기 적어도 하나의 유사화자 음성 신호에 대한 상기 보조 음성 특성을 확인하는 보조 음성 특징 확인부를 포함하는 음성 신호 훈련 장치
4 4
제3항에 있어서,상기 유사화자 음성 신호 결정부는,상기 목표 화자의 음성 신호와 상기 다중 화자의 음성 신호에 대한 특성 파라미터의 유사도를 확인하는 유사도 확인부와,상기 목표 화자의 음성 신호와 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터의 유사도를 기반으로, 상기 다중 화자의 음성 신호로부터, 상기 유사화자 음성 신호를 결정하는 상기 유사화자 음성 신호 선택부를 포함하는 음성 신호 훈련 장치
5 5
제4항에 있어서,상기 유사도 확인부는,상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터를 산출하고, 상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터에 대한 시간적 정렬을 수행하여 미리 정해진 구간단위로 분할하는 특성 파라미터 구간 분할부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
6 6
제4항에 있어서,상기 유사도 확인부는,상기 미리 정해진 구간단위로 분할된 상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 미리 정해진 구간단위로 분할된 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터의 유사도를 측정하는 유사도 측정부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
7 7
제1항에 있어서,상기 보조 음성 특성은,여기 파라미터를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
8 8
제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호에 대한 여기 파라미터와, 상기 다중 화자의 음성 신호에 대한 여기 파라미터를 사용하여, 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
9 9
제2항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호에 대한 여기 파라미터와, 상기 다중 화자의 음성 신호에 대한 여기 파라미터의 유사도에 기초하여 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
10 10
음성 신호 훈련 방법에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 과정과,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스로부터, 적어도 하나의 선택 화자 음성 신호를 추출하는 과정과,상기 선택 화자 음성 신호에 대한 보조 음성 특성을 확인하는 과정과,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 과정을 포함하는 음성 신호 훈련 방법
11 11
음성 신호 훈련 장치에 있어서,목표화자의 음성 신호를 저장하는 목표화자 음성 데이터베이스와,다중화자의 음성 신호를 저장하는 다중화자 음성 데이터베이스와,상기 목표화자의 음성 신호로부터, 상기 목표화자의 제1 및 제2음성 특성을 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중화자의 음성 신호로부터 상기 다중화자의 제1 및 제2음성 특성을 추출하고, 추출된 상기 다중화자의 제1 및 제2음성 특성과 상기 목표화자의 제1 및 제2음성 특성에 기초하여, 적어도 하나의 유사화자 음성 신호를 선택하는 유사화자 데이터 선택부와, 상기 유사화자 음성 신호에 대한 상기 제1 및 제2음성 특성을 확인하는 유사화자 음성특성 확인부와,상기 목표화자와 유사화자의 상기 제1 및 제2음성 특성을 기반으로, 상기 제1 및 제2음성 특성과 텍스트와의 관계에 대한 모델을 훈련하여 상기 제1 및 제2음성 특성과 상기 텍스트와의 관계에 대한 맵핑 정보를 설정하는 음성 특성 모델 훈련부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
12 12
제11항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 제1 및 제2음성 특성과 상기 다중화자의 제1 및 제2음성 특성과의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 결정하는 것을 특징으로 하는 음성 신호 훈련 장치
13 13
제11항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성 사이의 유사도를 기반으로, 제1유사화자를 확인하는 제1유사화자 결정부와,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성 사이의 유사도를 기반으로, 제2유사화자를 확인하는 제2유사화자 결정부를 포함하는 하는 음성 신호 훈련 장치
14 14
제13항에 있어서,상기 제1유사화자 결정부는,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성에 대한 유사도를 확인하는 제1유사도 측정부와,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성에 대한 유사도를 기반으로, 상기 다중화자의 음성 신호로부터 상기 유사화자 음성 신호를 결정하는 제1유사화자 확인부를 포함하는 음성 신호 훈련 장치
15 15
제13항에 있어서,상기 제2유사화자 결정부는,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 유사도를 확인하는 제2유사도 측정부와,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 유사도를 기반으로, 상기 다중화자의 음성 신호로부터 상기 유사화자 음성 신호를 결정하는 제2유사화자 확인부를 포함하는 음성 신호 훈련 장치
16 16
제15항에 있어서,상기 제2유사화자 결정부는,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 시간적 정렬을 수행하여 미리 정해진 구간단위로 분할하는 제2음성 특성 구간 분할부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
17 17
제12항에 있어서,상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 추출하고, 추출된 상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 상기 유사화자 데이터 선택부에 제공하는 특징벡터 추출부를 더 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
18 18
제17항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 기준으로, 상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성의 시간격 정렬을 수행하고, 상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성의 유사도를 산출하는 것을 특징으로 하는 음성 신호 훈련 장치
19 19
제11항에 있어서,상기 유사화자 음성특성 생성부는,상기 목표화자의 상기 제1 및 제2음성 특성과 상기 유사화자 상기 제1 및 제2음성 특성에 대한 유사도에 기초한 가중치를 확인하고, 상기 유사화자 상기 제1 및 제2음성 특성에 상기 가중치를 적용하는 것을 특징으로 하는 음성 신호 훈련 장치
20 20
음성 합성 장치에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와,상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 유사화자 음성 신호를 추출하고, 상기 유사화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부와,상기 음성 파라미터 모델과 텍스트와의 관계에 대한 맵핑정보에 기초하여, 입력 텍스트에 대응되는 음성 파라미터를 확인하고, 상기 음성 파라미터를 반영하여 상기 입력 텍스트에 대응되는 합성 음성 신호를 생성하는 음성 합성부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20190019500 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
DOCDB 패밀리 정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 ETRI ETRI연구개발지원사업 시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발