맞춤기술찾기

이전대상기술

음 합성 방법, 음 합성 장치, 음 합성 학습 방법, 음 합성 학습 장치 및 음 합성 방법을 수행하는 컴퓨터 프로그램 및 음 합성 방법을 수행하는 컴퓨터 프로그램이 저장된 기록 매체

  • 기술번호 : KST2023006266
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 일 실시예에 따른 음 합성 장치는 복수의 소리 샘플을 획득하는 송수신부; 각 소리 샘플을 전처리하여 스펙트로그램(Spectrogram)으로 변환하는 전처리부; 및 각 소리 샘플의 스펙트로그램을 음색에 대한 정보가 최대화되는 잠재코드를 출력하도록 기 학습된 인공신경망의 인코더에 입력하여 복수의 잠재코드(Latent Code)를 생성하고, 각 소리 샘플에 기 설정된 가중치를 기초로, 복수의 잠재코드를 합성하여 하나의 합성 잠재코드를 생성하며, 합성 잠재코드를 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는 제어부를 포함할 수 있다.
Int. CL G10L 13/02 (2006.01.01) G10L 25/90 (2013.01.01) G10L 25/30 (2013.01.01) G10L 19/02 (2006.01.01) G10L 25/18 (2013.01.01) G06N 3/08 (2023.01.01)
CPC G10L 13/02(2013.01) G10L 25/90(2013.01) G10L 25/30(2013.01) G10L 19/02(2013.01) G10L 25/18(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020220020569 (2022.02.17)
출원인 성균관대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0123625 (2023.08.24) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.02.17)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이석한 경기도 용인시 수지구
2 VALERO PUCHE 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.02.17 수리 (Accepted) 1-1-2022-0177508-39
2 선행기술조사의뢰서
Request for Prior Art Search
2022.11.17 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2023.01.12 발송처리완료 (Completion of Transmission) 9-6-2023-0047212-19
4 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2023.03.21 수리 (Accepted) 1-1-2023-0321720-37
5 의견제출통지서
Notification of reason for refusal
2023.03.28 발송처리완료 (Completion of Transmission) 9-5-2023-0287688-11
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.05.30 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0597327-46
7 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.05.30 수리 (Accepted) 1-1-2023-0597314-53
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
복수의 소리 샘플을 획득하는 송수신부;각 소리 샘플을 전처리하여 스펙트로그램(Spectrogram)으로 변환하는 전처리부; 및상기 각 소리 샘플의 스펙트로그램을 음색에 대한 정보가 최대화되는 잠재코드를 출력하도록 기 학습된 인공신경망의 인코더에 입력하여 복수의 잠재코드(Latent Code)를 생성하고, 상기 각 소리 샘플에 기 설정된 가중치를 기초로, 상기 복수의 잠재코드를 합성하여 하나의 합성 잠재코드를 생성하며, 상기 합성 잠재코드를 상기 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는 제어부를 포함하는음 합성 장치
2 2
제 1 항에 있어서,상기 전처리부는,STFT(Shot-Time Fourier Transform)를 이용하여 상기 각 소리 샘플을 상기 스펙트로그램으로 변환하는음 합성 장치
3 3
제 1 항에 있어서,상기 전처리부는,상기 각 소리 샘플이 단일 프레임인지 여부를 판단하고, 상기 각 소리 샘플이 단일 프레임인 경우, 상기 각 소리 샘플을 전처리한 상기 단일 프레임에 대응하는 단일 시간 단계의 스펙트로그램을 상기 스펙트로그램으로서 획득하며, 상기 복수의 소리 샘플이 단일 프레임이 아닌 경우, 상기 각 소리 샘플을 전처리한 전체 스펙트로그램을 상기 스펙트로그램으로서 획득하는,음 합성 장치
4 4
제 3 항에 있어서,상기 인공신경망의 인코더는,상기 각 소리 샘플이 단일 프레임인 경우, 완전 연결 신경망(Fully Connected Layer)을 포함하고, 상기 각 소리 샘플이 단일 프레임이 아닌 경우, 합성 곱 신경망(Convolutional Neural Layer)을 포함하는,음 합성 장치
5 5
제 1 항에 있어서,상기 기 학습된 인공신경망은,복수의 학습용 소리 샘플 및 상기 복수의 학습용 소리 샘플의 학습용 정답 음높이 데이터를 획득하는 송수신부;각 소리 샘플을 전처리하여 학습용 스펙트로그램(Spectrogram)을 획득하는 전처리부; 및상기 학습용 스펙트로그램을 입력하여, 학습용 잠재코드를 생성하는 인코더부;상기 학습용 잠재코드를 입력하여 각 학습용 소리 샘플의 음색을 분류하는 제1 인공신경망; 상기 학습용 잠재코드를 입력하여 각 학습용 소리 샘플의 음높이를 분류하는 제2 인공신경망; 및 상기 학습용 잠재코드에 각 학습용 소리 샘플의 학습용 정답 음높이 데이터를 이어붙여, 학습용 결과 스펙트로그램으로 변환하는 디코더부을 포함하되,상기 인코더부는 상기 제1 인공신경망이 분류한 음높이를 기초로 분류된 음높이 분류의 오류가 최대화 되고, 상기 제2 인공신경망이 분류한 음색을 기초로 분류된 음색 분류의 오류가 최소화 되도록 상기 학습용 잠재코드를 생성하도록 학습되는,음 합성 장치
6 6
제 1 항에 있어서,상기 제어부는 기 설정된 음높이에 대응되는 데이터를 원 핫 임베딩(One-Hot embedding)으로 상기 합성 잠재코드에 더하여 음높이 합성 잠재코드를 생성하고, 상기 음높이 합성 잠재코드를 상기 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는,음 합성 장치
7 7
제 1 항에 있어서,상기 복수의 소리 샘플은,음악적 소리 샘플 및 비 음악적 소리 샘플 중 적어도 하나를 포함하는,음 합성 장치
8 8
제 1 항에 있어서,상기 제어부는,상기 합성 잠재코드를 기 학습된 인공신경망의 디코더에 입력하여 합성 스펙트로그램을 획득하고, 상기 획득된 합성 스펙트로그램을 그리핀-림(Griffin-Lim) 알고리즘을 이용하여 소리 데이터로 변환하는,음 합성 장치
9 9
복수의 학습용 소리 샘플 및 상기 복수의 학습용 소리 샘플의 학습용 정답 음높이 데이터를 획득하는 송수신부;각 소리 샘플을 전처리하여 학습용 스펙트로그램(Spectrogram)을 획득하는 전처리부; 상기 학습용 스펙트로그램을 입력하여, 학습용 잠재코드를 생성하는 인코더부;상기 학습용 잠재코드를 입력하여 각 학습용 소리 샘플의 음색을 분류하는 제1 인공신경망; 상기 학습용 잠재코드를 입력하여 각 학습용 소리 샘플의 음높이를 분류하는 제2 인공신경망; 및 상기 학습용 잠재코드에 각 학습용 소리 샘플의 학습용 정답 음높이 데이터를 이어붙여, 학습용 결과 스펙트로그램으로 변환하는 디코더부을 포함하되,상기 인코더부는 상기 제1 인공신경망이 분류한 음높이를 기초로 분류된 음높이 분류의 오류가 최대화 되고, 상기 제2 인공신경망이 분류한 음색을 기초로 분류된 음색 분류의 오류가 최소화 되도록 상기 학습용 잠재코드를 생성하도록 학습되는,음 합성 학습 장치
10 10
음 합성 장치에 의해 수행되는 음의 합성 방법에 있어서,복수의 소리 샘플을 획득하는 단계;각 소리 샘플을 전처리하여 스펙트로그램(Spectrogram)으로 변환하는 단계;상기 각 소리 샘플의 스펙트로그램을 음색에 대한 정보가 최대화되는 잠재코드를 출력하도록 기 학습된 인공신경망의 인코더에 입력하여 복수의 잠재코드(Latent Code)를 생성하는 단계;상기 각 소리 샘플에 기 설정된 가중치를 기초로, 상기 복수의 잠재코드를 합성하여 하나의 합성 잠재코드를 생성하는 단계; 및상기 합성 잠재코드를 상기 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는 단계를 포함하는음 합성 학습 방법
11 11
음 합성 학습 장치에 의해 수행되는 음의 합성 학습 방법에 있어서,복수의 학습용 소리 샘플 및 상기 복수의 학습용 소리 샘플의 학습용 정답 음높이 데이터를 획득하는 단계;각 소리 샘플을 전처리하여 학습용 스펙트로그램(Spectrogram)으로 변환하는 단계;상기 학습용 스펙트로그램을 인코더에 입력하여 학습용 잠재코드를 생성하는 단계;상기 학습용 잠재코드를 제1 인공신경망에 입력하여 학습용 소리 샘플의 음색을 분류하는 단계; 상기 학습용 잠재코드를 제2 인공신경망에 입력하여 학습용 소리 샘플의 음높이를 분류하는 단계; 및 상기 학습용 잠재코드에 각 학습용 소리 샘플의 학습용 정답 음높이 데이터를 이어붙여, 학습용 결과 스펙트로그램으로 변환하는 단계를 포함하되,상기 인코더는 상기 제1 인공신경망이 분류한 음높이를 기초로, 분류된 음높이 분류의 오류가 최대화 되고, 상기 제2 인공신경망이 분류한 음색을 기초로, 분류된 음색 분류의 오류가 최소화 되도록 상기 학습용 잠재코드를 생성하도록 학습되는음 합성 학습 방법
12 12
컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,복수의 소리 샘플을 획득하는 단계;각 소리 샘플을 전처리하여 스펙트로그램(Spectrogram)으로 변환하는 단계;상기 각 소리 샘플의 스펙트로그램을 음색에 대한 정보가 최대화되는 잠재코드를 출력하도록 기 학습된 인공신경망의 인코더에 입력하여 복수의 잠재코드(Latent Code)를 생성하는 단계;상기 각 소리 샘플에 기 설정된 가중치를 기초로, 상기 복수의 잠재코드를 합성하여 하나의 합성 잠재코드를 생성하는 단계; 및상기 합성 잠재코드를 상기 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는 단계를 포함하는 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 프로그램
13 13
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,복수의 소리 샘플을 획득하는 단계;각 소리 샘플을 전처리하여 스펙트로그램(Spectrogram)으로 변환하는 단계;상기 각 소리 샘플의 스펙트로그램을 음색에 대한 정보가 최대화되는 잠재코드를 출력하도록 기 학습된 인공신경망의 인코더에 입력하여 복수의 잠재코드(Latent Code)를 생성하는 단계;상기 각 소리 샘플에 기 설정된 가중치를 기초로, 상기 복수의 잠재코드를 합성하여 하나의 합성 잠재코드를 생성하는 단계; 및상기 합성 잠재코드를 상기 기 학습된 인공신경망의 디코더에 입력하여 합성 음을 생성하는 단계를 포함하는 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 판독 가능한 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.