맞춤기술찾기

이전대상기술

신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기 및 신경망 모델의 트레이닝 방법

  • 기술번호 : KST2022020295
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기 및 신경망 모델의 트레이닝 방법이 개시된다. 본 발명의 일실시예에 따른 오디오 신호의 부호화 방법은 현재 입력 신호와 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하는 단계; 상기 현재 입력 신호를 부호화하여 입력 특징 신호를 생성하는 단계; 상기 입력 특징 신호 및 이전 입력 신호에 상기 이전 가중치 정보를 이용하여 인코딩 신호를 결정하는 단계; 상기 인코딩 신호를 이산화하여 잠재 벡터를 생성하는 단계; 및 상기 잠재 벡터에 대응하여 복호화기에 전송되는 비트스트림을 생성하는 단계를 포함할 수 있다.
Int. CL G10L 19/038 (2013.01.01) G10L 25/30 (2013.01.01) G06N 3/08 (2006.01.01)
CPC G10L 19/038(2013.01) G10L 25/30(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020210049017 (2021.04.15)
출원인 한국전자통신연구원, 한동대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0142679 (2022.10.24) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 한동대학교 산학협력단 대한민국 경상북도 포항시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장인선 대전광역시 유성구
2 백승권 대전광역시 유성구
3 성종모 대전광역시 유성구
4 이태진 대전광역시 유성구
5 임우택 대전광역시 유성구
6 최희열 경상북도 포항시 북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.04.15 수리 (Accepted) 1-1-2021-0438854-87
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
오디오 신호의 부호화 방법에 있어서, 현재 입력 신호와 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하는 단계; 상기 현재 입력 신호를 부호화하여 입력 특징 신호를 생성하는 단계; 상기 입력 특징 신호 및 이전 입력 신호에 상기 이전 가중치 정보를 이용하여 인코딩 신호를 결정하는 단계; 상기 인코딩 신호를 이산화하여 잠재 벡터를 생성하는 단계; 및 상기 잠재 벡터에 대응하여 복호화기에 전송되는 비트스트림을 생성하는 단계를 포함하는 부호화 방법
2 2
제1항에 있어서,상기 복호화기에 의하여 상기 비트스트림으로부터 생성된 이산 특징 신호 및 출력 특징 신호를 이용하여 이전 가중치 정보를 수정하는 단계를 더 포함하고, 상기 이산 특징 신호는, 상기 비트스트림으로부터 복원된 잠재 벡터가 부호화됨으로써 생성되고, 상기 출력 특징 신호는, 상기 복호화기에 의하여 복원되는 출력 신호가 부호화됨으로써 생성되는, 부호화 방법
3 3
제1항에 있어서,상기 잠재 벡터를 생성하는 단계는, 상기 인코딩 신호의 이산 분포에 대한 이산 확률을 계산하고, 상기 계산된 이산 확률에 기초하여 상기 잠재 벡터를 생성하는, 부호화 방법
4 4
제2항에 있어서,상기 이전 가중치 정보를 수정하는 단계는, 트레이닝된 순환 신경망 모델에 상기 이전 가중치 정보, 상기 이산 특징 신호 및 상기 출력 특징 신호를 입력함으로써, 현재 가중치 정보를 생성하는, 부호화 방법
5 5
오디오 신호의 복호화 방법에 있어서, i) 현재 입력 신호로부터 부호화기에 의해 생성된 비트스트림 및 ii) 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하는 단계; 상기 비트스트림으로부터 추출된 잠재 벡터를 부호화하여 이산 특징 신호를 생성하는 단계;상기 이산 특징 신호와 상기 이전 가중치 정보에 기초하여 현재 출력 신호를 생성하는 단계를 포함하는 복호화 방법
6 6
제5항에 있어서,상기 출력 신호를 부호화하여 출력 특징 신호를 생성하는 단계; 및 상기 이산 특징 신호와 상기 출력 특징 신호를 상기 부호화기에 전송하는 단계를 더 포함하는 복호화 방법
7 7
제5항에 있어서,상기 잠재 벡터는, 상기 현재 입력 신호로부터 생성된 인코딩 신호의 이산 분포에 대한 이산 확률에 기초하여 생성되는, 복호화 방법
8 8
오디오 신호의 부호화 및 복호화에 이용되는 신경망 모델의 트레이닝 방법에 있어서, 현재 입력 신호와 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하는 단계; 상기 현재 입력 신호를 부호화하여 입력 특징 신호를 생성하는 단계; 상기 입력 특징 신호 및 이전 입력 신호에 상기 이전 가중치 정보를 이용하여 인코딩 신호를 결정하는 단계; 상기 인코딩 신호의 이산 분포에 대한 이산 확률을 계산하고, 상기 계산된 이산 확률에 기초하여 잠재 벡터를 생성하는 단계; 상기 잠재 벡터를 부호화하여 이산 특징 신호를 생성하는 단계;상기 이산 특징 신호와 상기 이전 가중치 정보에 기초하여 현재 출력 신호를 생성하는 단계; 및i) 상기 현재 입력 신호 및 현재 출력 신호 간의 차이 및 ii) 상기 현재 입력 신호로 계산된 이산 확률 및 상기 이전 입력 신호로 계산된 이산 확률 간의 차이에 기초하여, 상기 신경망 모델의 파라미터를 업데이트하는 단계를 포함하는 트레이닝 방법
9 9
오디오 신호의 부호화 방법을 수행하는 부호화기에 있어서, 상기 부호화기는 프로세서를 포함하고,상기 프로세서는, 현재 입력 신호와 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하고, 상기 현재 입력 신호를 부호화하여 입력 특징 신호를 생성하고, 상기 입력 특징 신호 및 이전 입력 신호에 상기 이전 가중치 정보를 이용하여 인코딩 신호를 결정하고, 상기 인코딩 신호를 이산화하여 잠재 벡터를 생성하고, 상기 잠재 벡터에 대응하여 복호화기에 전송되는 비트스트림을 생성하는,부호화기
10 10
제9항에 있어서,상기 프로세서는, 상기 복호화기에 의하여 상기 비트스트림으로부터 생성된 이산 특징 신호 및 출력 특징 신호를 이용하여 이전 가중치 정보를 수정하고, 상기 이산 특징 신호는, 상기 비트스트림으로부터 복원된 잠재 벡터가 부호화됨으로써 생성되고, 상기 출력 특징 신호는, 상기 복호화기에 의하여 복원되는 출력 신호가 부호화됨으로써 생성되는, 부호화기
11 11
제9항에 있어서,상기 프로세서는, 상기 인코딩 신호의 이산 분포에 대한 이산 확률을 계산하고, 상기 계산된 이산 확률에 기초하여 상기 잠재 벡터를 생성하는, 부호화기
12 12
제10항에 있어서,상기 프로세서는, 트레이닝된 순환 신경망 모델에 상기 이전 가중치 정보, 상기 이산 특징 신호 및 상기 출력 특징 신호를 입력함으로써, 현재 가중치 정보를 생성하는, 부호화기
13 13
오디오 신호의 복호화 방법을 수행하는 복호화기에 있어서, 상기 복호화기는 프로세서를 포함하고,상기 프로세서는, i) 현재 입력 신호로부터 부호화기에 의해 생성된 비트스트림 및 ii) 이전 입력 신호의 복호화 결과에 기초하여 결정된 이전 가중치 정보를 식별하고, 상기 비트스트림으로부터 추출된 잠재 벡터를 부호화하여 이산 특징 신호를 생성하고, 상기 이산 특징 신호와 상기 이전 가중치 정보에 기초하여 현재 출력 신호를 생성하는, 복호화기
14 14
제13항에 있어서,상기 프로세서는, 상기 출력 신호를 부호화하여 출력 특징 신호를 생성하고, 상기 이산 특징 신호와 상기 출력 특징 신호를 상기 부호화기에 전송하는, 복호화기
15 15
제13항에 있어서,상기 잠재 벡터는, 상기 현재 입력 신호로부터 생성된 인코딩 신호의 이산 분포에 대한 이산 확률에 기초하여 생성되는, 복호화기
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정부출연금사업(기관고유사업) 초실감 입체공간 미디어·콘텐츠 원천기술연구