맞춤기술찾기

이전대상기술

정규화 플로우를 활용한 오디오 신호를 부호화 및 복호화 하는 방법 및 그 학습 방법

  • 기술번호 : KST2023008087
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른 프로세서에 의해서 수행되는 입력 오디오 신호를 부호화 및 복호화 하는 방법에 있어서, 하나 이상의 플로우 블록 및 하나 이상의 분할 블록을 이용해 상기 입력 오디오 신호를 부호화 하는 단계, 하나 이상의 양자화 블록 및 대응되는 하나 이상의 역 양자화 블록을 이용해 상기 부호화된 신호를 복호화 단계로 전달하는 단계, 및 하나 이상의 역 플로우 블록 및 하나 이상의 모음 블록을 이용해 상기 전달 받은 부호화된 신호를 복호화 하여 복원 신호를 출력하는 단계를 포함한다.
Int. CL G10L 19/032 (2013.01.01) G10L 19/04 (2006.01.01) G10L 19/00 (2006.01.01) G06N 20/00 (2019.01.01)
CPC G10L 19/032(2013.01) G10L 19/04(2013.01) G10L 19/0017(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020220032180 (2022.03.15)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2023-0134856 (2023.09.22) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.11.01)
심사청구항수 19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장인선 대전광역시 유성구
2 백승권 대전광역시 유성구
3 성종모 대전광역시 유성구
4 이태진 대전광역시 유성구
5 임우택 대전광역시 유성구
6 조병호 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인이상 대한민국 서울특별시 서초구 바우뫼로 ***(양재동, 우도빌딩 *층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.03.15 수리 (Accepted) 1-1-2022-0279295-68
2 [심사청구]심사청구서·우선심사신청서
2022.11.01 수리 (Accepted) 1-1-2022-1156084-69
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
프로세서에 의해서 수행되는, N개(N은 2이상의 자연수)의 플로우 블록(들)과 (N-1)개의 분할 블록(들)을 이용하여 입력 신호를 부호화하는 방법으로,상기 N개의 플로우 블록(들) 중 k번째(k는 1이상 N-1 이하의 자연수) 플로우 블록이 입력 받은 신호를 잠재 표현으로 변환한 k번째 변환 신호를 상기 (N-1)개의 분할 블록(들) 중 k번째 분할 블록으로 전달하는 단계;상기 k번째 분할 블록이 상기 k번째 변환 신호를 소정의 비율로 나누어, 제1 분할 신호와 제2 분할 신호로 나누는 단계;상기 k번째 분할 블록이 상기 제1 분할 신호를 (k+1) 번째 플로우 블록에 전달하는 단계; 및N번째 플로우 블록이 변환한 신호 및 상기 제2 분할 신호들을 양자화 블록을 이용하여 양자화 하는 단계를 포함하는,부호화 방법
2 2
청구항 1에 있어서, 상기 플로우 블록은,정규화 플로우 기반의 생성 모델을 적용하여 학습된 생성 모델인 것을 특징으로 하는,부호화 방법
3 3
청구항 1에 있어서,상기 제2 분할 신호는,부호화기가 사용되는 환경에 따라 선택적으로 상기 분할 블록의 외부에 전달 되지 않는 것을 특징으로 하는,부호화 방법
4 4
청구항 3에 있어서, 상기 양자화 블록은, 상기 N번째 플로우 블록이 변환한 신호 및 상기 제2 분할 신호들마다 다른 양자화 스텝의 크기 값을 적용하는 것을 특징으로 하는,부호화 방법
5 5
청구항 4에 있어서,상기 양자화 블록은,상기 제2 분할 신호들을 전달하는 상기 분할 블록의 k값이 커질수록 더 작은 양자화 스텝의 크기 값을 적용하는 것을 특징으로 하는,부호화 방법
6 6
프로세서에 의해서 수행되는, N개(N은 2이상의 자연수)의 역 플로우 블록(들)과 (N-1)개의 모음 블록(Gather Block)(들)을 이용하여 신호를 복호화 하는 방법으로,상기 N개의 역 플로우 블록(들) 중 k번째(k는 1이상 N 이하의 자연수) 역 플로우 블록이 복원한 k번째 복원 신호를 상기 (N-1)개의 모음 블록(들) 중 (k-1)번째 모음 블록으로 전달하는 단계;상기 (k-1)번째 모음 블록이 역 양자화 블록으로부터 전달 받은 분할 신호 및 상기 k번째 역 플로우 블록에서 전달 받은 복원 신호를 합하여, (k-1)번째 역 플로우 블록에 전달하는 단계; 및 k 값이 1인, 1번째 역 플로우 블록이 최종 복원 신호를 출력하는 단계를 포함하는,복호화 방법
7 7
청구항 6에 있어서,상기 역 플로우 블록은,정규화 플로우 기반의 생성 모델을 적용하여 학습된 생성 모델인 것을 특징으로 하는,복호화 방법
8 8
청구항 6에 있어서,상기 (k-1)번째 모음 블록이 (k-1)번째 역 플로우 블록에 신호를 전달하는 단계는, 상기 역 양자화 블록으로부터 분할 신호를 수신하였는지 여부를 판단하는 단계를 더 포함하는 것을 특징으로 하는,복호화 방법
9 9
청구항 8에 있어서, 상기 분할 신호를 수신하지 않았다고 판단된 경우,(k-1)번째 예측 블록을 통하여 생성된 예측 신호를 수신하는 단계를 더 포함하는,복호화 방법
10 10
청구항 9에 있어서,상기 예측 블록은, 상기 예측 블록에 연결된 역 플로우 블록에서 전달받은 역 변환된 신호로부터 평균 및 분산을 추정하고, 추정된 평균 및 분산을 가지는 확률 분포로부터 예측 신호를 생성하여 상기 모음 블록에 전달하는 것을 특징으로 하는,복호화 방법
11 11
청구항 6에 있어서, 상기 역 양자화 블록은, 상기 역 양자화 블록 마다 서로 다른 양자화 스텝의 크기 값을 적용하는 것을 특징으로 하는, 복호화 방법
12 12
청구항 11에 있어서,상기 역 양자화 블록은,상기 역 양자화 블록이 신호를 전달하는 상기 모음 블록의 k값이 커질수록 더 작은 양자화 스텝의 크기 값을 적용하는 것을 특징으로 하는,복호화 방법
13 13
프로세서에 의해서 수행되는, 오디오 신호의 부호화 및 복호화를 위한 학습 방법에 있어서,하나 이상의 플로우 블록 및 하나 이상의 분할 블록을 이용하여 입력 오디오 신호를 부호화하여 부호화된 신호를 생성하는 단계(a);하나 이상의 양자화 블록 및 대응되는 하나 이상의 역 양자화 블록을 이용하여 상기 부호화된 신호를 변환하여 생성된 변환 신호를 복호화기로 전달하는 단계(b); 하나 이상의 역 플로우 블록 및 하나 이상의 모음(Gather) 블록을 이용하여 상기 전달 받은 역 양자화 된 신호를 복호화 하여 복원 신호를 출력하는 단계(c);하나 이상의 역 플로우 블록, 하나 이상의 모음 블록, 및 하나 이상의 예측 블록을 이용하여 복호화 하여 예측 복원 신호를 출력하는 단계(d); 및상기 단계(a) 내지 상기 단계(d)를 반복적으로 수행하며 획득되는 상기 입력 오디오 신호, 상기 복원 신호, 및 상기 예측 복원 신호를 기반으로 산출되는 손실 함수의 값을 최소화 하도록 상기 플로우 블록, 상기 역 플로우 블록 및 상기 예측 블록을 학습시키는 단계를 포함하는,학습 방법
14 14
청구항 13에 있어서,상기 손실 함수는 중간 단계에서 추출 분할된 변환 신호를 조건부로 하는 음의 로그 우도(Negative Log Likelihood), 및 상기 원본 오디오 신호, 상기 복원 신호, 및 상기 예측 복원 신호 간 오차의 가중치의 합을 통해 산출되는 것을 특징으로 하는,학습 방법
15 15
청구항 13에 있어서,상기 복원 신호를 생성하는 과정에서의 부호화 단계는,N개(N은 2이상의 자연수)의 플로우 블록(들)과 (N-1)개의 분할 블록(들)을 포함하여 수행되며,상기 N개의 플로우 블록(들) 중 k번째(k는 1이상 N-1 이하의 자연수) 플로우 블록이 입력 받은 신호를 잠재 표현으로 변환한 k번째 변환 신호를 상기 (N-1)개의 분할 블록(들) 중 k번째 분할 블록으로 전달하는 단계;상기 k번째 분할 블록이 상기 k번째 변환 신호를 소정의 비율로 나누어, 제1 분할 신호와 제2 분할 신호로 나누는 단계; 및상기 k번째 분할 블록이 상기 제1 분할 신호를 (k+1) 번째 플로우 블록에 전달하고, 상기 제2 분할 신호들을 대응되는 양자화 블록으로 전달하는 단계를 더 포함하는 것을 특징으로 하는,학습 방법
16 16
청구항 15에 있어서, 상기 복원 신호를 생성하는 과정에서의 복호화 단계는,선행하는 역 플로우 블록이 전달 받은 신호를 복호화 하는 단계(a);상기 모음 블록이 선행하는 역 플로우 블록의 복호화 신호 및 역 양자화 블록으로부터 전달 받은 분할 신호를 수신하여 후행하는 역 플로우 블록에 전달하는 단계(b); 및상기 단계(a) 내지 상기 단계(b)를 반복적으로 수행하며 상기 복원 신호를 출력하는 단계를 포함하는 것을 특징으로 하는,학습 방법
17 17
청구항 13에 있어서,상기 예측 복원 신호를 생성하는 과정에서의 복호화 단계는,역 플로우 블록이 입력 받은 신호를 복호화 하여 모음(Gather) 블록 및 예측 블록에 전달하는 단계(a);상기 예측블록이 상기 전달 받은 복호화된 신호를 토대로 예측 신호를 생성하여 상기 모음 블록에 전달하는 단계(b);상기 모음 블록은 상기 역 플로우 블록에서 전달 받은 신호 및 상기 예측 신호를 후행 역 플로우 블록에 전달하는 단계(c); 상기 모음 블록이 선행 역 플로우 블록의 복호화 신호 및 선행 예측 블록의 예측 신호를 후행 역 플로우 블록에 전달하는 단계(d); 및상기 단계(a) 내지 단계(d)를 반복적으로 수행하며 예측 복원 신호를 출력하는 단계를 더 포함하는 것을 특징으로 하는, 학습 방법
18 18
청구항 13에 있어서,상기 손실 함수 값을 최소화 하는 단계는,오차역전파(Backpropagation)를 통하여 상기 플로우 블록, 상기 역 플로우 블록 및 상기 예측 블록의 생성 모델의 가중치를 갱신하는 단계를 더 포함하는, 학습 방법
19 19
청구항 13에 있어서,상기 플로우 블록 및 상기 역 플로우 블록은 가역 변환 함수가 적용되며, 상기 플로우 블록 및 대응되는 역 플로우 블록은 상호 역 변환 구조를 갖는 것을 특징으로 하는,학습 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정부출연금사업(기관고유사업) 초실감 입체공간 미디어·콘텐츠 원천기술연구