맞춤기술찾기

이전대상기술

오디오 신호의 부호화 및 복호화 방법 및 장치

  • 기술번호 : KST2021009369
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 오디오 신호의 부호화 및 복호화 방법 및 장치가 개시된다. 본 발명의 일실시예에 따른 부호화 방법은 입력 신호를 프레임 단위에 따라 음성 신호 또는 오디오 신호 중 어느 하나로 분류하는 단계; 상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 부호화 방식에 따라 부호화하는 단계; 상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 상기 입력 신호의 프레임을 주파수 도메인의 부호화 방식에 따라 코어 대역에서 부호화하는 단계; 및 상기 입력 신호의 부호화된 결과를 비트스트림으로 생성하는 단계를 포함할 수 있다.
Int. CL H04N 21/233 (2011.01.01) H04N 21/2343 (2011.01.01) H04N 21/43 (2011.01.01)
CPC
출원번호/일자 1020200036281 (2020.03.25)
출원인 한국전자통신연구원, 서울시립대학교 산학협력단
등록번호/일자
공개번호/일자 10-2021-0086394 (2021.07.08) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020190177912   |   2019.12.30
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 백승권 대전광역시 유성구
2 성종모 대전광역시 유성구
3 이태진 대전광역시 유성구
4 이미숙 대전광역시 유성구
5 임우택 대전광역시 유성구
6 장인선 대전광역시 유성구
7 김인철 서울특별시 동대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.03.25 수리 (Accepted) 1-1-2020-0313158-30
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력 신호를 프레임 단위에 따라 음성 신호 또는 오디오 신호 중 어느 하나로 분류하는 단계;상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 부호화 방식에 따라 부호화하는 단계;상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 상기 입력 신호의 프레임을 주파수 도메인의 부호화 방식에 따라 코어 대역에서 부호화하는 단계; 및상기 입력 신호의 부호화된 결과를 비트스트림으로 생성하는 단계를 포함하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 coreCoderFrameLength에 대응하는 sbrRatio, outputFrameLength, QMF band ratio 및 Mps212 numSlot를 포함하는 파라미터가 상기 비트스트림에 포함되는, 부호화 방법
2 2
제1항에 있어서, 상기 파라미터에서,상기 coreCoderFrameLength는, 800 샘플이고, 상기 outputFrameLength는, 800 샘플이고, 상기 sbrRatio는 NO SBR로 설정되고, 상기 Mps212 numSlot은 NA(Not Applicable)로 설정되는, 부호화 방법
3 3
제1항에 있어서, 상기 파라미터에서,상기 coreCoderFrameLength는 800 샘플이고, 상기 outputFrameLength는 1600 샘플이고, 상기 sbrRatio는 2:1이고, 상기 Mps212 numSlot은 25이고, 상기 QMF band ratio는 32:64인, 부호화 방법
4 4
입력 신호가 부호화된 결과와 입력 신호의 프레임의 길이에 대응하는 파라미터를 포함하는 비트스트림을 수신하는 단계;상기 비트스트림에서 입력 신호의 프레임 단위에 따라 오디오 신호 인지 또는 음성 신호인지를 판단하는 단계;상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 복호화 방식에 따라 복호화하는 단계;상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 상기 입력 신호의 프레임을 주파수 도메인의 복호화 방식에 따라 코어 대역에서 복호화하는 단계; 및상기 코어 대역에서 복호화된 입력 신호를 상기 파라미터에 기초하여 처리하는 단계를 포함하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 파라미터는, 상기 coreCoderFrameLength에 대응하는 sbrRatio, outputFrameLength, QMF band ratio 및 Mps212 numSlot를 포함하는, 복호화 방법
5 5
제4항에 있어서, 상기 처리하는 단계는,상기 coreCoderFrameLength에 대응하는 sbrRatio에 따라 상기 입력 신호의 주파수 대역을 확장하는, 복호화 방법
6 6
제4항에 있어서, 상기 처리하는 단계는,상기 coreCoderFrameLength에 대응하는 Mps212에서 사용되는 Mps212 numSlot에 따라 상기 입력 신호를 업믹싱(up-mixing)하는, 복호화 방법
7 7
제4항에 있어서, 상기 파라미터에서,상기 coreCoderFrameLength는, 800 샘플이고, 상기 outputFrameLength는, 800 샘플이고, 상기 sbrRatio는 NO SBR로 설정되고, 상기 Mps212 numSlot은 NA(Not Applicable)로 설정되는, 복호화 방법
8 8
제4항에 있어서, 상기 파라미터에서,상기 coreCoderFrameLength는 800 샘플이고, 상기 outputFrameLength는 1600 샘플이고, 상기 sbrRatio는 2:1이고, 상기 Mps212 numSlot은 25이고, 상기 QMF band ratio는 32:64인, 복호화 방법
9 9
입력 신호를 프레임 단위에 따라 음성 신호 또는 오디오 신호 중 어느 하나로 분류하는 단계;상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 부호화 방식에 따라 부호화하는 단계;상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 주파수 도메인의 부호화 방식에 따라 상기 입력 신호의 프레임에 윈도우를 적용하여 코어 대역에서 부호화하는 단계; 및상기 입력 신호의 부호화된 결과를 비트스트림으로 생성하는 단계를 포함하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,i) 상기 coreCoderFrameLength 및 ii) 상기 윈도우의 종류를 나타내는 window_sequence에 대응하는, noiseFillingStartOffset을 포함하는 파라미터가 상기 비트스트림에 포함되는, 부호화 방법
10 10
제9항에 있어서, 상기 noiseFillingStartOffset는,상기 coreCoderFrameLength가 800 샘플이고, 상기 window_sequence가 EIGHT_SHORT_SEQUENCE인 경우 16 bin이고, 상기 coreCoderFrameLength가 800 샘플이고, 상기 window_sequence가 상기 EIGHT_SHORT_SEQUENCE를 제외한 나머지 window_sequence 중 하나인 경우, 125 bin인, 부호화 방법
11 11
입력 신호가 부호화된 결과와 입력 신호의 프레임의 길이에 대응하는 파라미터를 포함하는 비트스트림을 수신하는 단계;상기 비트스트림에서 입력 신호의 프레임 단위에 따라 오디오 신호 인지 또는 음성 신호인지를 판단하는 단계;상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 복호화 방식에 따라 복호화하는 단계;상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 주파수 도메인의 복호화 방식에 따라 상기 입력 신호의 프레임에 윈도우를 적용하여 코어 대역에서 복호화하는 단계; 및상기 코어 대역에서 복호화된 입력 신호를 상기 파라미터에 기초하여 처리하는 단계를 포함하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 파라미터는, i) 상기 coreCoderFrameLength 및 ii) 상기 윈도우의 종류를 나타내는 window_sequence에 대응하는, noiseFillingStartOffset를 포함하고,상기 주파수 도메인의 복호화 방식에 따라 복호화 단계는, 상기 입력 신호의 프레임에 대해 상기 noiseFillingStartOffset에 따른 주파수 위치에서 Noise filling을 수행하고, 주파수 도메인의 복호화 방식에 따라 코어 대역에서 복호화하는, 복호화 방법
12 12
제11항에 있어서, 상기 coreCoderFrameLength는 800 샘플이고,상기 noiseFillingStartOffset는,상기 window_sequence가 EIGHT_SHORT_SEQUENCE인 경우, 16 bin이고, 상기 window_sequence가 상기 EIGHT_SHORT_SEQUENCE를 제외한 나머지 window_sequence 중 하나인 경우, 125 bin인, 복호화 방법
13 13
부호화 장치는 프로세서를 포함하고,상기 프로세서는,입력 신호를 프레임 단위에 따라 음성 신호 또는 오디오 신호 중 어느 하나로 분류하고, 상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 부호화 방식에 따라 부호화하고, 상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 상기 입력 신호의 프레임을 주파수 도메인의 부호화 방식에 따라 코어 대역에서 부호화하고, 상기 입력 신호의 부호화된 결과를 비트스트림으로 생성하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 coreCoderFrameLength에 대응하는 sbrRatio, outputFrameLength, QMF band ratio 및 Mps212 numSlot를 포함하는 파라미터가 상기 비트스트림에 포함되는,부호화 장치
14 14
제13항에 있어서, 상기 파라미터에서,상기 coreCoderFrameLength는, 800 샘플이고, 상기 outputFrameLength는, 800 샘플이고, 상기 sbrRatio는 NO SBR로 설정되고, 상기 Mps212 numSlot은 NA(Not Applicable)로 설정되는, 부호화 장치
15 15
제13항에 있어서, 상기 파라미터에서, 상기 coreCoderFrameLength는 800 샘플이고, 상기 outputFrameLength는 1600 샘플이고, 상기 sbrRatio는 2:1이고, 상기 Mps212 numSlot은 25이고, 상기 QMF band ratio는 32:64인, 부호화 장치
16 16
복호화 장치는 프로세서를 포함하고,상기 프로세서는,입력 신호가 부호화된 결과와 입력 신호의 프레임의 길이에 대응하는 파라미터를 포함하는 비트스트림을 수신하고, 상기 비트스트림에서 입력 신호의 프레임 단위에 따라 오디오 신호 인지 또는 음성 신호인지를 판단하고, 상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 복호화 방식에 따라 복호화하고, 상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 상기 입력 신호의 프레임을 주파수 도메인의 복호화 방식에 따라 코어 대역에서 복호화하고, 상기 코어 대역에서 복호화된 입력 신호를 상기 파라미터에 기초하여 처리하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 파라미터는, 상기 coreCoderFrameLength에 대응하는 sbrRatio, outputFrameLength, QMF band ratio 및 Mps212 numSlot를 포함하는, 복호화 장치
17 17
제16항에 있어서, 상기 파라미터에서, 상기 coreCoderFrameLength는, 800 샘플이고, 상기 outputFrameLength는, 800 샘플이고, 상기 sbrRatio는 NO SBR로 설정되고, 상기 Mps212 numSlot은 NA(Not Applicable)로 설정되는, 복호화 장치
18 18
제16항에 있어서, 상기 파라미터에서, 상기 coreCoderFrameLength는 800 샘플이고, 상기 outputFrameLength는 1600 샘플이고, 상기 sbrRatio는 2:1이고, 상기 Mps212 numSlot은 25이고, 상기 QMF band ratio는 32:64인, 복호화 장치
19 19
부호화 장치는 프로세서를 포함하고,상기 프로세서는,입력 신호를 프레임 단위에 따라 음성 신호 또는 오디오 신호 중 어느 하나로 분류하고, 상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 부호화 방식에 따라 부호화하고, 상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 주파수 도메인의 부호화 방식에 따라 상기 입력 신호의 프레임에 윈도우를 적용하여 코어 대역에서 부호화하고, 상기 입력 신호의 부호화된 결과를 비트스트림으로 생성하고, 상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,i) 상기 coreCoderFrameLength 및 ii) 상기 윈도우의 종류를 나타내는 window_sequence에 대응하는, noiseFillingStartOffset을 포함하는 파라미터가 상기 비트스트림에 포함되는, 부호화 장치
20 20
부호화 장치는 프로세서를 포함하고,상기 프로세서는,입력 신호가 부호화된 결과와 입력 신호의 프레임의 길이에 대응하는 파라미터를 포함하는 비트스트림을 수신하고, 상기 비트스트림에서 입력 신호의 프레임 단위에 따라 오디오 신호 인지 또는 음성 신호인지를 판단하고, 상기 입력 신호의 프레임이 음성 신호로 분류된 경우, 상기 입력 신호의 프레임을 시간 도메인의 복호화 방식에 따라 복호화하고, 상기 입력 신호의 프레임이 오디오 신호로 분류된 경우, 주파수 도메인의 복호화 방식에 따라 상기 입력 신호의 프레임에 윈도우를 적용하여 코어 대역에서 복호화하고, 상기 코어 대역에서 복호화된 입력 신호를 상기 파라미터에 기초하여 처리하고,상기 입력 신호를 구성하는 프레임의 길이는, coreCoderFrameLength로 표현되고,상기 파라미터는, i) 상기 coreCoderFrameLength 및 ii) 상기 윈도우의 종류를 나타내는 window_sequence에 대응하는, noiseFillingStartOffset를 포함하고,상기 프로세서는, 상기 입력 신호의 프레임에 대해 상기 noiseFillingStartOffset에 따른 주파수 위치에서 Noise filling을 수행하고, 주파수 도메인의 복호화 방식에 따라 코어 대역에서 복호화하는, 복호화 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 ETRI연구개발지원사업 초고실감 미디어 서비스 실현을 위해 HEVC/3DA 대비 2배 압축을 제공하는 5세대 비디오/오디오 표준 핵심 기술 개발 및 표준화