맞춤기술찾기

이전대상기술

음성 합성 장치 및 방법

  • 기술번호 : KST2022013961
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 음성 합성 장치가 제공된다. 상기 음성 합성 장치는 제1 화자와 제1 환경을 갖는 제1 발성을 획득하고, 제2 화자와 제2 환경을 갖는 제2 발성을 획득하는 획득 유니트; 상기 제2 화자와 상기 제1 환경을 갖는 제3 발성을 생성하는 합성 유니트;를 포함할 수 있다.
Int. CL G10L 13/06 (2006.01.01) G10L 13/02 (2006.01.01) G10L 17/02 (2013.01.01) G10L 17/06 (2013.01.01) G10L 17/04 (2013.01.01)
CPC G10L 13/06(2013.01) G10L 13/02(2013.01) G10L 17/02(2013.01) G10L 17/06(2013.01) G10L 17/04(2013.01)
출원번호/일자 1020190061001 (2019.05.24)
출원인 서울시립대학교 산학협력단
등록번호/일자 10-2273147-0000 (2021.06.29)
공개번호/일자 10-2020-0134868 (2020.12.02) 문서열기
공고번호/일자 (20210705) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.05.24)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 양일호 서울특별시 강동구
2 유하진 서울특별시 동대문구
3 허희수 경기도 의정부시 용민로 ***,
4 윤성현 경기도 수원시 장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 천지 대한민국 서울특별시 강남구 논현로**길 **, *층(역삼동, 신한빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 서울특별시 동대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.05.24 수리 (Accepted) 1-1-2019-0532696-94
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.09.10 수리 (Accepted) 4-1-2019-5191631-69
3 선행기술조사의뢰서
Request for Prior Art Search
2020.04.10 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2020.05.15 발송처리완료 (Completion of Transmission) 9-6-2020-0141302-00
5 의견제출통지서
Notification of reason for refusal
2020.09.25 발송처리완료 (Completion of Transmission) 9-5-2020-0666008-26
6 [지정기간연장]기간 연장신청서·기간 단축신청서·기간 경과 구제신청서·절차 계속신청서
2020.11.25 수리 (Accepted) 1-1-2020-1268236-82
7 [지정기간연장]기간 연장신청서·기간 단축신청서·기간 경과 구제신청서·절차 계속신청서
2020.12.24 수리 (Accepted) 1-1-2020-1411779-73
8 [지정기간연장]기간 연장신청서·기간 단축신청서·기간 경과 구제신청서·절차 계속신청서
2021.01.25 수리 (Accepted) 1-1-2021-0098860-75
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.01.29 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-0123668-92
10 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2021.01.29 수리 (Accepted) 1-1-2021-0123667-46
11 등록결정서
Decision to grant
2021.06.28 발송처리완료 (Completion of Transmission) 9-5-2021-0508656-65
12 특허고객번호 정보변경(경정)신고서·정정신고서
2022.01.25 수리 (Accepted) 4-1-2022-5020718-60
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
목소리 데이터를 포함하는 화자가 정의되고, 주변 잡음 데이터를 포함하는 환경이 정의되며, 상기 화자와 상기 환경이 포함된 발성이 정의될 때,제1 화자와 제1 환경을 갖는 제1 발성을 획득하고, 제2 화자와 제2 환경을 갖는 제2 발성을 획득하는 획득 유니트;상기 제2 화자와 상기 제1 환경을 갖는 제3 발성을 생성하는 합성 유니트를 포함하고,상기 합성 유니트에는 생성부 및 판별부가 마련되며,상기 생성부는 실제의 상기 제1 발성, 실제의 상기 제2 발성 및 랜덤 노이즈를 기초로 상기 제3 발성을 생성하고,상기 판별부는 상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하며,상기 생성부는 상기 제2 발성의 상기 제2 화자에 상기 제1 발성의 상기 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 획득 유니트는 상기 제1 발성에 복수의 환경을 부가하며,상기 획득 유니트에 의해 서로 다른 환경이 부가된 상기 제1 발성에 해당하는 복수의 가공 발성이 마련되고,상기 판별부는 상기 제3 발성을 거짓으로 판별하도록 학습되며,상기 생성부는 상기 판별부에 의해 상기 제3 발성이 참으로 판별되도록, 상기 가공 발성을 이용하여 상기 제3 발성을 생성하는 음성 합성 장치
2 2
제1항에 있어서,상기 제1 발성과 상기 제3 발성을 비교하는 식별부가 마련되고,상기 식별부는 비교 결과를 이용해서 상기 제1 발성이 등록된 복수의 사용자 중에서 상기 제2 발성에 가장 유사한 사용자를 검색하는 음성 합성 장치
3 3
제1항에 있어서,상기 제1 발성과 상기 제3 발성을 비교하는 확인부가 마련되고,상기 확인부는 비교 결과를 이용해서 상기 제2 발성의 사용자가 기등록된 상기 제1 발성의 사용자와 일치하는지 여부를 판단하는 음성 합성 장치
4 4
제1항에 있어서,상기 합성 유니트에는 추출부 및 합성부가 마련되고,상기 추출부는 상기 제1 발성으로부터 상기 제1 환경을 추출하고, 상기 제2 발성으로부터 상기 제2 화자를 추출하며,상기 합성부는 상기 추출부에 의해 추출된 상기 제1 환경과 상기 제2 화자가 합성된 상기 제3 발성을 생성하는 음성 합성 장치
5 5
제1항에 있어서,상기 제1 발성과 상기 제2 발성을 기초로 상기 제3 발성을 생성하는 cGAN(conditional Generative Adversarial Network) 모듈이 마련된 음성 합성 장치
6 6
제5항에 있어서,상기 제1 발성이 기등록된 상태에서 상기 제1 발성과 비교 대상이 되는 상기 제2 발성이 입력되면, 상기 cGAN 모듈은 상기 제2 발성을 대체할 수 있는 상기 제3 발성을 생성하는 음성 합성 장치
7 7
삭제
8 8
삭제
9 9
삭제
10 10
실제의 제1 발성, 실제의 제2 발성 및 랜덤 노이즈를 기초로 제3 발성을 생성하는 생성부;상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하는 판별부;를 포함하고,상기 생성부는 상기 제2 발성의 제2 화자에 상기 제1 발성의 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 제1 발성을 획득하는 획득 유니트가 마련되고,상기 획득 유니트는 상기 제1 발성에 복수의 환경을 부가하며,상기 획득 유니트에 의해 서로 다른 환경이 부가된 상기 제1 발성에 해당하는 복수의 가공 발성이 마련되고,상기 판별부는 상기 제3 발성을 거짓으로 판별하도록 학습되며,상기 생성부는 상기 판별부에 의해 상기 제3 발성이 참으로 판별되도록, 상기 가공 발성을 이용하여 상기 제3 발성을 생성하는 음성 합성 장치
11 11
실제의 제1 발성, 실제의 제2 발성 및 랜덤 노이즈를 기초로 제3 발성을 생성하는 생성부;상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하는 판별부;를 포함하고,상기 생성부는 상기 제2 발성의 제2 화자에 상기 제1 발성의 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 제1 발성을 획득하는 획득 유니트가 마련되고,상기 획득 유니트는 상기 제1 발성을 후처리하며, 후처리된 상기 제1 발성을 상기 생성부에 제공하고,상기 후처리는 제1 처리, 제2 처리 및 제3 처리 중 적어도 하나를 포함하며,상기 제1 처리는 상기 제1 발성을 다운 샘플링 후 업 샘플링하는 것이고,상기 제2 처리는 상기 제1 발성에 배경 잡음을 추가하는 것이며,상기 제3 처리는 상기 제1 발성에 손실 압축 코덱을 적용하는 것인 음성 합성 장치
12 12
실제의 제1 발성, 실제의 제2 발성 및 랜덤 노이즈를 기초로 제3 발성을 생성하는 생성부;상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하는 판별부;를 포함하고,상기 생성부는 상기 제2 발성의 제2 화자에 상기 제1 발성의 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 판별부는 제1 조건, 제2 조건 및 제3 조건이 모두 만족되는 경우에 한해 상기 제3 발성을 참으로 판별하도록 학습되고,상기 제1 조건은 상기 제3 발성이 상기 생성부에 의해 생성된 가짜 데이터가 아니라 진짜 데이터로 판별되는 것이며,상기 제2 조건은 상기 제3 발성의 화자가 상기 제2 발성의 제2 화자와 동일한 것이고,상기 제3 조건은 상기 제3 발성의 환경이 상기 제2 발성의 제2 환경과 동일한 것인 음성 합성 장치
13 13
실제의 제1 발성, 실제의 제2 발성 및 랜덤 노이즈를 기초로 제3 발성을 생성하는 생성부;상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하는 판별부;를 포함하고,상기 생성부는 상기 제2 발성의 제2 화자에 상기 제1 발성의 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 판별부는 첫번째 발성과 두번째 발성 간의 비교를 통해 학습하고,상기 첫번째 발성은 상기 제1 발성 또는 상기 제2 발성이며,상기 두번째 발성은 상기 제1 발성, 상기 제2 발성, 상기 제3 발성 중 하나이고,상기 판별부는 상기 제3 발성을 거짓으로 판별하도록 학습되고,상기 생성부는 상기 판별부에 의해서 참으로 판별되는 상기 제3 발성을 생성하도록 학습되며,상기 판별부의 학습을 실행하고, 상기 생성부의 학습을 실행하는 실행부가 마련되고,상기 실행부는 상기 생성부가 상기 판별부를 속이는 속임 성공값이 설정값을 만족할 때까지 상기 판별부의 학습과 상기 생성부의 학습을 번갈아 실행하며,상기 실행부는 상기 판별부의 학습 중에는 상기 생성부의 학습을 중단시키고,상기 실행부는 상기 생성부의 학습 중에는 상기 판별부의 학습을 중단시키는 음성 합성 장치
14 14
삭제
15 15
실제의 제1 발성, 실제의 제2 발성 및 랜덤 노이즈를 기초로 제3 발성을 생성하는 생성부;상기 제2 발성에 대한 상기 제3 발성의 진위를 판별하는 판별부;를 포함하고,상기 생성부는 상기 제2 발성의 제2 화자에 상기 제1 발성의 제1 환경이 함께 포함되는 방향으로 상기 제3 발성을 생성하며,상기 제1 환경 하에서 실제로 녹음된 상기 제2 화자를 갖는 가상의 발성이 목표 발성으로 정의될 때,상기 생성부와 상기 판별부는 상기 제3 발성이 상기 목표 발성을 추종하도록, GAN(Generative Adversarial Network) 기법에 따라 상호 적대적으로 반복 학습하고,상기 제1 환경 하에서 실제로 녹음된 상기 제1 화자를 갖는 상기 제1 발성을 상기 제3 발성과 비교하는 인식 유니트가 마련되며,상기 인식 유니트는 상기 생성부와 상기 판별부의 반복 학습의 결과로 도출된 상기 제3 발성을 이용해서, 서로 동일한 상기 제1 환경 하에서 상기 제1 화자와 상기 제2 화자를 비교하는 음성 합성 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 경찰청 서울시립대학교 치안과학기술연구개발(R&D) 과학수사를 위한 화자인식 시스템 개발