1 |
1
손실 결정 방법에 있어서, 입력 신호를 식별하는 단계; 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 입력하여 출력 신호를 생성하는 단계; 상기 입력 신호 및 상기 출력 신호를 주파수 영역으로 변환하는 단계;상기 주파수 영역으로 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 기초하여, 부호화 잡음을 결정하는 단계;심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 결정하는 단계; 상기 부호화 잡음과 상기 마스킹 임계치를 비교하여 잡음-마스킹 비율을 계산하는 단계; 및상기 잡음-마스킹 비율에 따라 지각적 손실을 결정하는 단계를 포함하는 손실 결정 방법
|
2 |
2
제1항에 있어서, 상기 부호화 잡음과 상기 마스킹 임계치를 멜-주파수 영역으로 변환하는 단계를 더 포함하고, 상기 잡음-마스킹 비율을 계산하는 단계는,상기 멜-주파수 영역으로 변환된 부호화 잡음과 상기 변환된 마스킹 임계치의 차이에 따라 잡음-마스킹 비율을 결정하는, 손실 결정 방법
|
3 |
3
제1항에 있어서, 상기 부호화 잡음은, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 대한 파워 스펙트럼(power spectrum)에 따라 결정되는, 손실 결정 방법
|
4 |
4
제1항에 있어서,상기 지각적 손실을 결정하는 단계는,지각 엔트로피(perceptual entropy)를 나타내는 파라미터와 상기 잡음-마스킹 비율을 연산함으로써 상기 지각적 손실을 결정하는, 손실 결정 방법
|
5 |
5
제4항에 있어서,상기 손실을 결정하는 단계는,상기 주파수 영역 입력 신호와 상기 마스킹 임계치로부터 지각적 엔트로피(perceptual entropy)를 계산하는 단계; 상기 지각적 엔트로피를 서로 다른 해상도를 갖는 복수의 멜-주파수 영역으로 변환하는 단계; 상기 멜-주파수 영역 지각적 엔트로피부터 각 멜-주파수 영역에 대한 가중치를 계산하는 단계; 및상기 상기 잡음 대 마스크비와 상기 가중치를 연산함으로써 상기 손실을 결정하는 단계를 포함하는, 손실 결정 방법
|
6 |
6
제1항에 있어서,상기 지각적 손실을 결정하는 단계는, i) 상기 잡음-마스킹 비율 및 ii) 상기 입력 신호 및 상기 출력 신호의 차이에 따른 오차에 기초하여, 상기 지각적 손실을 결정하는, 손실 결정 방법
|
7 |
7
제1항에 있어서,상기 지각적 손실이 최소가 되도록 상기 신경망 모델에 포함되는 파라미터를 업데이트하는 단계를 더 포함하는, 손실 결정 방법
|
8 |
8
손실 결정 방법에 있어서, 입력 신호를 식별하는 단계; 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 적용하여 출력 신호를 생성하는 단계; 상기 입력 신호와 상기 출력 신호의 차이에 기초하여, 오차 손실을 결정하는 단계;i) 상기 입력 신호와 상기 출력 신호의 차이에 따른 부호화 잡음 및 ii) 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 비교하여 지각적 손실을 결정하는 단계;상기 신경망 모델의 부호화 과정에서 생성되는 잠재 변수에 대한 엔트로피에 기초하여 엔트로피 손실을 결정하는 단계; 및 상기 오차 손실, 지각적 손실 및 엔트로피 제3 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 결정하는 단계를 포함하는 손실 결정 방법
|
9 |
9
제8항에 있어서,상기 전체 손실을 결정하는 단계는, 상기 오차 손실, 지각적 손실 및 엔트로피 손실 중 적어도 하나 이상의 가중합으로 상기 전체 손실을 계산하는, 손실 결정 방법
|
10 |
10
제8항에 있어서,상기 잠재 변수의 소프트맥스(softmax) 양자화 결과와 하드(hard) 양자화 결과의 차이에 기초하여 양자화 패널티 손실을 결정하는 단계를 더 포함하고,상기 전체 손실을 결정하는 단계는, 상기 오차 손실, 지각적 손실, 양자화 패널티 손실 및 엔트로피 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 계산하는, 손실 결정 방법
|
11 |
11
제8항에 있어서,상기 지각적 손실을 결정하는 단계는, 상기 부호화 잡음 및 상기 마스킹 임계치의 차이에 기초하여 결정되는 잡음-마스킹 비율에 따라 상기 지각적 손실을 결정하는, 손실 결정 방법
|
12 |
12
손실 결정 장치에 있어서, 상기 손실 결정 장치는 프로세서를 포함하고,상기 프로세서는, 입력 신호를 식별하고, 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 입력하여 출력 신호를 생성하고, 상기 입력 신호 및 상기 출력 신호를 주파수 영역으로 변환하고, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 기초하여, 부호화 잡음을 결정하고, 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 결정하고, 상기 부호화 잡음과 상기 마스킹 임계치를 비교하여 잡음-마스킹 비율을 계산하고, 상기 잡음-마스킹 비율에 따라 지각적 손실을 결정하는,손실 결정 장치
|
13 |
13
제12항에 있어서,상기 프로세서는, 상기 부호화 잡음과 상기 마스킹 임계치를 멜-주파수 영역으로 변환하고, 상기 변환된 부호화 잡음과 상기 변환된 마스킹 임계치의 차이에 따라 잡음-마스킹 비율을 결정하는, 손실 결정 장치
|
14 |
14
제12항에 있어서, 상기 부호화 잡음은, 상기 변환된 입력 신호 및 상기 변환된 출력 신호 간의 차이에 대한 파워 스펙트럼(power spectrum)에 따라 결정되는, 손실 결정 장치
|
15 |
15
제12항에 있어서,상기 프로세서는, 지각 엔트로피(perceptual entropy)를 나타내는 파라미터와 상기 잡음-마스킹 비율을 연산함으로써 상기 지각적 손실을 결정하는, 손실 결정 장치
|
16 |
16
제12항에 있어서,상기 프로세서는, i) 상기 잡음-마스킹 비율 및 ii) 상기 입력 신호 및 상기 출력 신호의 차이에 따른 오차에 기초하여, 상기 지각적 손실을 결정하는, 손실 결정 장치
|
17 |
17
제12항에 있어서,상기 프로세서는, 상기 지각적 손실이 최소가 되도록 상기 신경망 모델에 포함되는 파라미터를 업데이트하는, 손실 결정 장치
|
18 |
18
손실 결정 장치에 있어서, 상기 손실 결정 장치는 프로세서를 포함하고,상기 프로세서는, 입력 신호를 식별하고, 오디오 신호의 코딩을 수행하는 신경망 모델에 상기 입력 신호를 적용하여 출력 신호를 생성하고, 상기 입력 신호와 상기 출력 신호의 차이에 기초하여, 오차 손실을 결정하고, i) 상기 입력 신호와 상기 출력 신호의 차이에 따른 부호화 잡음 및 ii) 심리 음향 모델(psychoacoustic model)에 따른 마스킹 임계치를 비교하여 지각적 손실을 결정하고, 상기 신경망 모델의 부호화 과정에서 생성되는 잠재 변수에 대한 엔트로피에 기초하여 엔트로피 손실을 결정하고, 상기 오차 손실, 지각적 손실 및 엔트로피 제3 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 결정하는손실 결정 장치
|
19 |
19
제18항에 있어서,상기 프로세서는, 상기 오차 손실, 지각적 손실 및 엔트로피 손실 중 적어도 하나 이상의 가중합으로 상기 전체 손실을 계산하는, 손실 결정 장치
|
20 |
20
제18항에 있어서,상기 프로세서는, 상기 잠재 변수의 소프트맥스(softmax) 양자화 결과와 하드(hard) 양자화 결과의 차이에 기초하여 양자화 패널티 손실을 결정하고, 상기 오차 손실, 지각적 손실, 양자화 패널티 손실 및 엔트로피 손실 중 적어도 하나 이상의 손실을 이용하여 전체 손실을 계산하는, 손실 결정 장치
|