1 |
1
오디오 신호의 부호화 방법에 있어서, 상기 오디오 신호의 저주파 대역에 대응하는 입력 신호를 식별하는 단계;상기 입력 신호에 윈도잉(windowing)을 수행하는 단계; 제1 부호화 모델에 상기 윈도잉된 입력 신호를 입력하여 제1 잠재 벡터를 생성하는 단계; 상기 윈도잉된 입력 신호를 주파수 영역으로 변환하는 단계; 상기 변환된 입력 신호를 제2 부호화 모델에 입력하여 제2 잠재 벡터를 생성하는 단계; 상기 제1 잠재 벡터와 상기 제2 잠재 벡터를 결합하여 최종 잠재 벡터를 생성하는 단계; 및 상기 최종 잠재 벡터에 대응하는 비트스트림을 생성하는 단계를 포함하는 부호화 방법
|
2 |
2
제1항에 있어서, 상기 제1 부호화 모델은, 상기 최종 잠재 벡터로부터 생성된 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여 트레이닝되는 신경망 모델인, 부호화 방법
|
3 |
3
제1항에 있어서, 상기 제1 부호화 모델은, 다운 샘플링(down-sampling)을 수행하는 복수의 스케일 블록 및 합성곱 연산을 수행하는 합성곱 계층을 포함하는, 부호화 방법
|
4 |
4
오디오 신호의 복호화 방법에 있어서, 부호화기에 의해 생성된 비트스트림을 식별하는 단계; 상기 비트스트림으로부터 잠재 벡터를 추출하는 단계; 및상기 잠재 벡터를 복호화 모델에 입력하여 출력 신호를 생성하는 단계를 포함하고,상기 잠재 벡터는, 입력 신호의 시간 영역의 특징을 나타내는 잠재 벡터 및 상기 입력 신호의 주파수 영역의 특징을 나타내는 잠재 벡터가 결합되고,상기 입력 신호는, 상기 오디오 신호의 저주파 대역에 포함되는 오디오 신호인, 복호화 방법
|
5 |
5
제4항에 있어서, 상기 복호화 모델은, 상기 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여 트레이닝되는 신경망 모델인, 복호화 방법
|
6 |
6
오디오 신호의 부호화 및 복호화에 이용되는 신경망 모델의 트레이닝 방법에 있어서, 상기 오디오 신호의 저주파 대역에 대응하는 입력 신호에 윈도잉(windowing)을 수행하는 단계; 제1 부호화 모델에 상기 윈도잉된 입력 신호를 입력하여 제1 잠재 벡터를 생성하는 단계; 상기 윈도잉된 입력 신호를 주파수 영역으로 변환하는 단계; 상기 변환된 입력 신호를 제2 부호화 모델에 입력하여 제2 잠재 벡터를 생성하는 단계; 상기 제1 잠재 벡터와 상기 제2 잠재 벡터를 결합하여 최종 잠재 벡터를 생성하는 단계; 상기 최종 잠재 벡터를 복호화 모델에 입력하여 출력 신호를 생성하는 단계; 및상기 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여, 상기 제1 부호화 모델 및 상기 복호화 모델을 트레이닝하는 단계를 포함하는 트레이닝 방법
|
7 |
7
제6항에 있어서,상기 제1 부호화 모델은, 다운 샘플링(down-sampling)을 수행하는 복수의 스케일 블록 및 합성곱 연산을 수행하는 합성곱 계층을 포함하는, 트레이닝 방법
|
8 |
8
오디오 신호의 부호화 방법을 수행하는 부호화기에 있어서,상기 부호화기는 프로세서를 포함하고,상기 프로세서는, 상기 오디오 신호의 저주파 대역에 대응하는 입력 신호를 식별하고, 상기 입력 신호에 윈도잉(windowing)을 수행하고, 제1 부호화 모델에 상기 윈도잉된 입력 신호를 입력하여 제1 잠재 벡터를 생성하고, 상기 윈도잉된 입력 신호를 주파수 영역으로 변환하고, 상기 변환된 입력 신호를 제2 부호화 모델에 입력하여 제2 잠재 벡터를 생성하고, 상기 제1 잠재 벡터와 상기 제2 잠재 벡터를 결합하여 최종 잠재 벡터를 생성하고, 상기 최종 잠재 벡터에 대응하는 비트스트림을 생성하는부호화기
|
9 |
9
제8항에 있어서, 상기 제1 부호화 모델은, 상기 최종 잠재 벡터로부터 생성된 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여 트레이닝되는 신경망 모델인, 부호화기
|
10 |
10
제8항에 있어서, 상기 제1 부호화 모델은, 다운 샘플링(down-sampling)을 수행하는 복수의 스케일 블록 및 합성곱 연산을 수행하는 합성곱 계층을 포함하는, 부호화기
|
11 |
11
오디오 신호의 복호화 방법을 수행하는 복호화기에 있어서,상기 복호화기는 프로세서를 포함하고,상기 프로세서는, 부호화기에 의해 생성된 비트스트림을 식별하고, 상기 비트스트림으로부터 잠재 벡터를 추출하고, 상기 잠재 벡터를 복호화 모델에 입력하여 출력 신호를 생성하고,상기 잠재 벡터는, 입력 신호의 시간 영역의 특징을 나타내는 잠재 벡터 및 상기 입력 신호의 주파수 영역의 특징을 나타내는 잠재 벡터가 결합되고,상기 입력 신호는, 상기 오디오 신호의 저주파 대역에 포함되는 오디오 신호인, 복호화기
|
12 |
12
제11항에 있어서, 상기 복호화 모델은, 상기 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여 트레이닝되는 신경망 모델인, 복호화기
|
13 |
13
오디오 신호의 부호화 및 복호화에 이용되는 신경망 모델의 트레이닝 방법을 수행하는 부호화기에 있어서, 상기 부호화기는 프로세서를 포함하고,상기 프로세서는, 상기 오디오 신호의 저주파 대역에 대응하는 입력 신호에 윈도잉(windowing)을 수행하고, 제1 부호화 모델에 상기 윈도잉된 입력 신호를 입력하여 제1 잠재 벡터를 생성하고, 상기 윈도잉된 입력 신호를 주파수 영역으로 변환하고, 상기 변환된 입력 신호를 제2 부호화 모델에 입력하여 제2 잠재 벡터를 생성하고, 상기 제1 잠재 벡터와 상기 제2 잠재 벡터를 결합하여 최종 잠재 벡터를 생성하고, 상기 최종 잠재 벡터를 복호화 모델에 입력하여 출력 신호를 생성하고, 상기 출력 신호와 상기 오디오 신호 간 시간 영역의 차이 및 상기 출력 신호와 상기 오디오 신호 간 주파수 영역의 차이에 기초하여, 상기 제1 부호화 모델 및 상기 복호화 모델을 트레이닝하는,부호화기
|
14 |
14
제13항에 있어서,상기 제1 부호화 모델은, 다운 샘플링(down-sampling)을 수행하는 복수의 스케일 블록 및 합성곱 연산을 수행하는 합성곱 계층을 포함하는, 부호화기
|