맞춤기술찾기

이전대상기술

음성 합성 시스템의 동작방법

  • 기술번호 : KST2022013141
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은, 제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계, 상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 함성 모델을 생성하는 단계 및 음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고, 상기 음성 합성 모델을 생성하는 단계는, 상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계 및 상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하는 음성 합성 시스템의 동작방법을 제공한다.
Int. CL G10L 13/08 (2006.01.01) G10L 13/02 (2006.01.01) G10L 25/18 (2013.01.01)
CPC G10L 13/08(2013.01) G10L 13/02(2013.01) G10L 25/18(2013.01)
출원번호/일자 1020210004856 (2021.01.13)
출원인 한양대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0102476 (2022.07.20) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.13)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장준혁 서울특별시 성동구
2 황성웅 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 심경식 대한민국 서울시 강남구 역삼로 *** 동아빌딩 *층(에스와이피특허법률사무소)
2 홍성욱 대한민국 서울시 강남구 역삼로 *** 동아빌딩 *층(에스와이피특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.13 수리 (Accepted) 1-1-2021-0046521-50
2 선행기술조사의뢰서
Request for Prior Art Search
2021.09.09 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2021.12.15 발송처리완료 (Completion of Transmission) 9-6-2022-0075238-62
4 의견제출통지서
Notification of reason for refusal
2022.04.29 발송처리완료 (Completion of Transmission) 9-5-2022-0323115-83
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2022.06.08 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2022-0595949-43
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2022.06.08 수리 (Accepted) 1-1-2022-0595948-08
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
제1 텍스트와 상기 제1 텍스트에 대한 제1 음성 및 제2 텍스트와 상기 제2 텍스트에 대한 제2 음성이 입력되는 단계;상기 제1, 2 텍스트 및 상기 제1, 2 음성을 커리큘럼 러닝(Curriculum learning)에 적용하여 학습한 음성 함성 모델을 생성하는 단계; 및음성 출력을 위한 대상 텍스트 입력 시, 상기 음성 합성 모델을 기반으로 상기 대상 텍스트에 대응하는 대상 합성 음성을 출력하는 단계를 포함하고,상기 음성 합성 모델을 생성하는 단계는,상기 제1, 2 텍스트를 결합한 결합 텍스트 및 상기 제1, 2 음성을 결합한 결합 음성을 생성하는 단계; 및상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 에러 레이트(error rate)가 설정된 기준 레이트(reference rate)보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 상기 음성 합성 모델에 추가하는 단계를 포함하는,음성 합성 시스템의 동작방법
2 2
제 1 항에 있어서,상기 결합 텍스트는,상기 제1, 2 텍스트 및 상기 제1, 2 텍스트를 구분하는 텍스트 토큰(text token)을 포함하는,음성 합성 시스템의 동작방법
3 3
제 2 항에 있어서,상기 결합 음성은,상기 제1, 2 음성 및 상기 제1, 2 음성을 구분하는 멜스펙트로그램 토큰(mel spectrogram-token)을 포함하는,음성 합성 시스템의 동작방법
4 4
제 3 항에 있어서,상기 텍스트 토큰 및 상기 멜스펙트로그램 토큰은,1초 내지 2초의 시간 구간을 갖는,음성 합성 시스템의 동작방법
5 5
제 3 항에 있어서,상기 텍스트 토큰 및 상기 멜스펙트로그램 토큰은,묵음 구간인,음성 합성 시스템의 동작방법
6 6
제 3 항에 있어서,상기 음성 합성 모델에 추가하는 단계는,상기 텍스트 토큰 및 상기 멜스펙트로그램 토큰을 기준으로 결합하는,음성 합성 시스템의 동작방법
7 7
제 1 항에 있어서,상기 음성 합성 모델에 추가하는 단계 이전에,상기 결합 텍스트 및 상기 결합 음성의 학습 결합 시 배치 사이즈(batch size)가 설정된 기준 배치 사이즈보다 작으면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는 단계를 더 포함하는,음성 합성 시스템의 동작방법
8 8
제 1 항에 있어서,상기 음성 합성 모델에 추가하는 단계는,상기 에러 레이트가 상기 기준 레이트보다 크면 상기 결합 텍스트 및 상기 결합 음성을 초기화하는,음성 합성 시스템의 동작방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서울대학교 산학협력단 정보통신·방송 연구개발 사업 소량 데이터만을 이용한 고품질 종단형(End-to-End) 기반의 딥러닝 다화자 운율 및 감정 복제 기술 개발