맞춤기술찾기

이전대상기술

생성 모델 기반의 음성 코덱 복원 방법 및 장치, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램

  • 기술번호 : KST2022001644
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 실시예의 생성 모델 기반의 음성 코덱 복원 장치는 음성 비트스트림 정보를 수집하는 정보 수집부와, 상기 음성 비트스트림 정보를 기초로 각 비트들의 특징을 추출하는 임베딩부와, 상기 특징과 랜덤 변수를 입력으로 하여 음성을 복원하는 신경망 보코더를 포함할 수 있다. 실시예는 비트스트림의 비트들 간의 관계를 추출하고 이를 이용하여 음성을 복원함으로써, 하나의 코덱에 대한 적용이 아닌 일반적인 코덱에 모두 적용 가능한 효과가 있다.
Int. CL G10L 19/16 (2013.01.01) G10L 25/18 (2013.01.01) G10L 25/15 (2013.01.01) G10L 25/21 (2013.01.01) G06N 3/08 (2006.01.01) G10L 25/30 (2013.01.01)
CPC G10L 19/167(2013.01) G10L 25/18(2013.01) G10L 25/15(2013.01) G10L 25/21(2013.01) G06N 3/08(2013.01) G10L 25/30(2013.01)
출원번호/일자 1020200090965 (2020.07.22)
출원인 국방과학연구소
등록번호/일자
공개번호/일자 10-2022-0012463 (2022.02.04) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.07.22)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 나선필 대전광역시 유성구
2 김남수 서울특별시 관악구
3 김형용 서울특별시 관악구
4 김석민 서울특별시 관악구
5 한민현 서울특별시 관악구
6 손병찬 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.07.22 수리 (Accepted) 1-1-2020-0765463-85
2 선행기술조사의뢰서
Request for Prior Art Search
2020.09.10 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 비트스트림 정보를 수집하는 정보 수집부;상기 음성 비트스트림 정보를 기초로 각 비트들의 특징을 추출하는 임베딩부; 및상기 특징과 랜덤 변수를 입력으로 하여 음성을 복원하는 신경망 보코더;를 포함하는 생성 모델 기반의 음성 코덱 복원 장치
2 2
제1항에 있어서,상기 랜덤 변수는 가우시안 랜덤변수를 포함하고, 상기 랜덤 변수는 0 내지 1사이의 값을 포함하는 생성 모델 기반의 음성 코덱 복원 장치
3 3
제1항에 있어서,상기 신경망 보코더는 음성 비트스트림 정보, 음성 및 랜덤 변수를 이용하여 학습시키는 생성 모델 기반의 음성 코덱 복원 장치
4 4
제3항에 있어서,상기 신경망 보코더는 NLL(Negative log Likelihood)이 최소값을 가질 때까지 학습시키는 생성 모델 기반의 음성 코덱 복원 장치
5 5
제1항에 있어서,상기 임베딩부는 딥 러닝 모델을 이용하여 각 비트들 간의 특징을 추출하는 생성 모델 기반의 음성 코덱 복원 장치
6 6
제5항에 있어서,상기 특징은 비트의 스펙트럼, 주파수, 피치 및 파워 정보를 포함하는 생성 모델 기반의 음성 코덱 복원 장치
7 7
제5항에 있어서,상기 딥 러닝 모델은 FCN, CNN 및 RNN을 포함하는 생성 모델 기반의 음성 코덱 복원 장치
8 8
생성 모델 기반의 음성 코덱 복원 장치에서 수행되는 생성 모델 기반의 음성 코덱 복원 방법에 있어서,음성 비트스트림 정보를 수집하는 단계;상기 음성 비트스트림 정보를 기초로 각 비트들 간의 특징을 추출하는 단계; 및상기 특징과 랜덤 변수를 입력으로 한 생성 모델 기반의 신경망 보코더를 이용하여 음성을 복원하는 단계;를 포함하는 생성 모델 기반의 음성 코덱 복원 방법
9 9
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,상기 컴퓨터 프로그램은, 음성 비트스트림 정보를 수집하는 단계;상기 음성 비트스트림 정보를 기초로 각 비트들 간의 특징을 추출하는 단계; 및상기 특징과 랜덤 변수를 입력으로 한 생성 모델 기반의 신경망 보코더를 이용하여 음성을 복원하는 단계;를 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 판독 가능한 기록매체
10 10
컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,상기 컴퓨터 프로그램은, 음성 비트스트림 정보를 수집하는 단계;상기 음성 비트스트림 정보를 기초로 각 비트들 간의 특징을 추출하는 단계; 및상기 특징과 랜덤 변수를 입력으로 한 생성 모델 기반의 신경망 보코더를 이용하여 음성을 복원하는 단계;를 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.