기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

다중 화자 데이터를 이용한 딥러닝 기반 음성 합성 장치 및 방법

기술번호 : KST2019000112
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	음성 신호 훈련 방법 및 장치가 개시된다. 본 개시의 일 실시 예에 따른 음성 신호 훈련 장치는 목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와, 다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와, 상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 선택 화자 음성 신호를 추출하고, 상기 선택 화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와, 상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부를 포함할 수 있다.
Int. CL	G10L 13/02 (2006.01.01) G10L 13/08 (2006.01.01) G10L 17/02 (2013.01.01) G10L 17/04 (2013.01.01) G10L 17/18 (2013.01.01) G10L 25/03 (2013.01.01)
CPC
출원번호/일자	1020180081395 (2018.07.13)
출원인	한국전자통신연구원, 연세대학교 산학협력단
등록번호/일자
공개번호/일자	10-2019-0008137 (2019.01.23) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보	대한민국 \| 1020170088994 \| 2017.07.13 대한민국 \| 1020170147101 \| 2017.11.07
법적상태	공개
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구
2	연세대학교 산학협력단	대한민국	서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	주소
1	장인선	대전광역시 유성구
2	강홍구	서울특별시 서대문구
3	강현주	서울특별시 서대문구
4	주영선	서울특별시 서대문구
5	안충현	대전광역시 유성구
6	서정일	대전광역시 유성구
7	양승준	대전광역시 유성구
8	최지훈	대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	성병기	대한민국	서울특별시 서초구 사임당로 , 층 (서초동, 재우빌딩)(마루특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2018.07.13	수리 (Accepted)	1-1-2018-0690570-77

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 음성 신호 훈련 장치에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와,상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 유사화자 음성 신호를 추출하고, 상기 유사화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
2	2 제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호와의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
3	3 제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호와 상기 다중 화자의 음성 신호와의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 결정하는 유사화자 음성 신호 결정부와,상기 적어도 하나의 유사화자 음성 신호에 대한 상기 보조 음성 특성을 확인하는 보조 음성 특징 확인부를 포함하는 음성 신호 훈련 장치
4	4 제3항에 있어서,상기 유사화자 음성 신호 결정부는,상기 목표 화자의 음성 신호와 상기 다중 화자의 음성 신호에 대한 특성 파라미터의 유사도를 확인하는 유사도 확인부와,상기 목표 화자의 음성 신호와 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터의 유사도를 기반으로, 상기 다중 화자의 음성 신호로부터, 상기 유사화자 음성 신호를 결정하는 상기 유사화자 음성 신호 선택부를 포함하는 음성 신호 훈련 장치
5	5 제4항에 있어서,상기 유사도 확인부는,상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터를 산출하고, 상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터에 대한 시간적 정렬을 수행하여 미리 정해진 구간단위로 분할하는 특성 파라미터 구간 분할부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
6	6 제4항에 있어서,상기 유사도 확인부는,상기 미리 정해진 구간단위로 분할된 상기 목표 화자의 음성 신호에 대한 상기 특성 파라미터와, 상기 미리 정해진 구간단위로 분할된 상기 다중 화자의 음성 신호에 대한 상기 특성 파라미터의 유사도를 측정하는 유사도 측정부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
7	7 제1항에 있어서,상기 보조 음성 특성은,여기 파라미터를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
8	8 제1항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호에 대한 여기 파라미터와, 상기 다중 화자의 음성 신호에 대한 여기 파라미터를 사용하여, 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
9	9 제2항에 있어서,상기 유사화자 음성 파라미터 확인부는,상기 학습 대상 음성 신호에 대한 여기 파라미터와, 상기 다중 화자의 음성 신호에 대한 여기 파라미터의 유사도에 기초하여 상기 적어도 하나의 유사화자 음성 신호를 추출하는 것을 특징으로 하는 음성 신호 훈련 장치
10	10 음성 신호 훈련 방법에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 과정과,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스로부터, 적어도 하나의 선택 화자 음성 신호를 추출하는 과정과,상기 선택 화자 음성 신호에 대한 보조 음성 특성을 확인하는 과정과,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 과정을 포함하는 음성 신호 훈련 방법
11	11 음성 신호 훈련 장치에 있어서,목표화자의 음성 신호를 저장하는 목표화자 음성 데이터베이스와,다중화자의 음성 신호를 저장하는 다중화자 음성 데이터베이스와,상기 목표화자의 음성 신호로부터, 상기 목표화자의 제1 및 제2음성 특성을 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중화자의 음성 신호로부터 상기 다중화자의 제1 및 제2음성 특성을 추출하고, 추출된 상기 다중화자의 제1 및 제2음성 특성과 상기 목표화자의 제1 및 제2음성 특성에 기초하여, 적어도 하나의 유사화자 음성 신호를 선택하는 유사화자 데이터 선택부와, 상기 유사화자 음성 신호에 대한 상기 제1 및 제2음성 특성을 확인하는 유사화자 음성특성 확인부와,상기 목표화자와 유사화자의 상기 제1 및 제2음성 특성을 기반으로, 상기 제1 및 제2음성 특성과 텍스트와의 관계에 대한 모델을 훈련하여 상기 제1 및 제2음성 특성과 상기 텍스트와의 관계에 대한 맵핑 정보를 설정하는 음성 특성 모델 훈련부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
12	12 제11항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 제1 및 제2음성 특성과 상기 다중화자의 제1 및 제2음성 특성과의 유사도를 기반으로 상기 적어도 하나의 유사화자 음성 신호를 결정하는 것을 특징으로 하는 음성 신호 훈련 장치
13	13 제11항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성 사이의 유사도를 기반으로, 제1유사화자를 확인하는 제1유사화자 결정부와,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성 사이의 유사도를 기반으로, 제2유사화자를 확인하는 제2유사화자 결정부를 포함하는 하는 음성 신호 훈련 장치
14	14 제13항에 있어서,상기 제1유사화자 결정부는,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성에 대한 유사도를 확인하는 제1유사도 측정부와,상기 목표화자의 제1음성 특성과 상기 다중화자의 제1음성 특성에 대한 유사도를 기반으로, 상기 다중화자의 음성 신호로부터 상기 유사화자 음성 신호를 결정하는 제1유사화자 확인부를 포함하는 음성 신호 훈련 장치
15	15 제13항에 있어서,상기 제2유사화자 결정부는,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 유사도를 확인하는 제2유사도 측정부와,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 유사도를 기반으로, 상기 다중화자의 음성 신호로부터 상기 유사화자 음성 신호를 결정하는 제2유사화자 확인부를 포함하는 음성 신호 훈련 장치
16	16 제15항에 있어서,상기 제2유사화자 결정부는,상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성에 대한 시간적 정렬을 수행하여 미리 정해진 구간단위로 분할하는 제2음성 특성 구간 분할부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
17	17 제12항에 있어서,상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 추출하고, 추출된 상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 상기 유사화자 데이터 선택부에 제공하는 특징벡터 추출부를 더 포함하는 것을 특징으로 하는 음성 신호 훈련 장치
18	18 제17항에 있어서,상기 유사화자 데이터 선택부는,상기 목표화자의 음성 신호에 대한 특징벡터와, 상기 다중화자의 음성 신호에 대한 특징벡터를 기준으로, 상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성의 시간격 정렬을 수행하고, 상기 목표화자의 제2음성 특성과 상기 다중화자의 제2음성 특성의 유사도를 산출하는 것을 특징으로 하는 음성 신호 훈련 장치
19	19 제11항에 있어서,상기 유사화자 음성특성 생성부는,상기 목표화자의 상기 제1 및 제2음성 특성과 상기 유사화자 상기 제1 및 제2음성 특성에 대한 유사도에 기초한 가중치를 확인하고, 상기 유사화자 상기 제1 및 제2음성 특성에 상기 가중치를 적용하는 것을 특징으로 하는 음성 신호 훈련 장치
20	20 음성 합성 장치에 있어서,목표 화자의 음성 신호를 저장하는 목표 화자 음성 데이터베이스와,다중 화자의 음성 신호를 저장하는 다중 화자 음성 데이터베이스와,상기 목표 화자의 음성 신호로부터, 학습 대상 음성 신호에 대한 음성 파라미터를 추출하는 목표화자 음성 파라미터 추출부와, 상기 다중 화자의 음성 신호로부터, 적어도 하나의 유사화자 음성 신호를 추출하고, 상기 유사화자 음성 신호에 대한 보조 음성 특성을 확인하는 유사화자 음성 파라미터 확인부와,상기 음성 파라미터 및 상기 보조 음성 특성을 사용하여, 상기 음성 파라미터와 텍스트와의 관계에 대한 모델을 훈련하여 음성 파라미터 모델을 결정하고, 상기 음성 파라미터 모델과 상기 텍스트와의 관계에 대한 맵핑정보를 설정하는 음성 파라미터 모델 훈련부와,상기 음성 파라미터 모델과 텍스트와의 관계에 대한 맵핑정보에 기초하여, 입력 텍스트에 대응되는 음성 파라미터를 확인하고, 상기 음성 파라미터를 반영하여 상기 입력 텍스트에 대응되는 합성 음성 신호를 생성하는 음성 합성부를 포함하는 것을 특징으로 하는 음성 신호 훈련 장치

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
1	US20190019500	US	미국	FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번	패밀리번호	국가코드	국가명	종류
DOCDB 패밀리 정보가 없습니다

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	미래창조과학부	ETRI	ETRI연구개발지원사업	시청각장애인 방송접근권 향상을 위한 디지털자막·음성해설 서비스 기술 개발

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2018.07.13	수리 (Accepted)	1-1-2018-0690570-77

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2020004265][한국전자통신연구원]	생성 모델 기반 데이터 증강 기법을 활용한 딥러닝 기반 감정음성합성 장치 및 방법	새창보기
[KST2017015106][한국전자통신연구원]	딥러닝 기반의 음성 합성 시스템을 위한 피치 동기화 음성 합성 방법(Text-to-Speech Synthesis Method using Pitch Synchronization in Deep Learning Based Text-to-Speech Synthesis System)	새창보기
[KST2015087189][한국전자통신연구원]	사용자 정보를 이용한 다국어 자동통역기의 언어인식 장치	새창보기
[KST2015082120][한국전자통신연구원]	다채널 퍼지 융합을 통한 지능형 로봇의 화자 인식 장치 및그 방법	새창보기
[KST2015098330][한국전자통신연구원]	다단계 음성인식 장치 및 그 장치에서의 다단계 음성인식방법	새창보기
[KST2018004407][한국전자통신연구원]	자동 통역 시스템(Automatic Interpretation System)	새창보기
[KST2020002495][한국전자통신연구원]	발화자의 감정 분석에 따른 언어 순화 장치	새창보기
[KST2015084602][한국전자통신연구원]	이동 단말기 및 그 제어방법	새창보기
[KST2015082062][한국전자통신연구원]	음성 인식을 통한 컨텐츠 정보 서비스 제공 장치 및 그방법	새창보기
[KST2015086796][한국전자통신연구원]	다채널 화자 식별 시스템 및 다채널 화자 식별 방법	새창보기
[KST2015087828][한국전자통신연구원]	음성인식결과 문장에 대한 문형분류장치 및 방법	새창보기
[KST2015091022][한국전자통신연구원]	자동 통역 방법	새창보기
[KST2015095473][한국전자통신연구원]	지능형 로봇 서비스 시스템에서 무선 마이크로폰을 이용한화자 인식 방법 및 장치	새창보기
[KST2015095842][한국전자통신연구원]	멀티모달 융합을 위한 환경변수 측정방법	새창보기
[KST2020016705][한국전자통신연구원]	감정 토큰을 이용한 감정 음성 합성 방법 및 장치	새창보기
[KST2015080935][한국전자통신연구원]	성대신호 인식 장치 및 그 방법	새창보기
[KST2015096006][한국전자통신연구원]	온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치	새창보기
[KST2015091863][한국전자통신연구원]	자동 통역 장치 및 방법	새창보기
[KST2015091455][한국전자통신연구원]	자동 번역 및 통역 장치 및 그 방법	새창보기
[KST2015079218][한국전자통신연구원]	방송 음성 데이터를 이용한 영역 및 화자 의존 음성 합성장치, 음성 합성용 데이터베이스 구축방법 및 음성 합성서비스 시스템	새창보기
[KST2015084433][한국전자통신연구원]	하이브리드 특징벡터 처리 방법 및 이를 이용한 화자 인식 방법과 장치	새창보기
[KST2016000877][한국전자통신연구원]	자동 통역 방법 및 이를 실행하는 장치	새창보기
[KST2015093446][한국전자통신연구원]	음성 및 영상에 기반한 성별-연령 판별방법 및 그 장치	새창보기
[KST2021010786][한국전자통신연구원]	종단형 음성인식기의 강화학습 기반 준지도학습 방법 및 장치	새창보기
[KST2022006160][한국전자통신연구원]	자동음성인식을 위한 음성 데이터 생성 방법	새창보기
[KST2017014832][한국전자통신연구원]	감성 기반 음성자막 제공 장치 및 방법(Apparatus and method for supporting audio subtitles based on emotion)	새창보기
[KST2015077076][한국전자통신연구원]	그래픽 사용자 인터페이스를 이용한 합성 음성 분석 방법	새창보기
[KST2022007554][한국전자통신연구원]	음성 인식 장치, 그의 음성 데이터 학습 방법 및 추론 방법	새창보기
[KST2017006748][한국전자통신연구원]	전자문서 내 표 데이터의 음성 변환 장치 및 방법(Apparatus and method for text-to-speech conversion of table data on electronic document)	새창보기
[KST2015083815][한국전자통신연구원]	음성 합성 방법 및 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.