1 |
1
음성 신호로부터 특징 벡터를 추출하는 특징 벡터 추출부;상기 특징 벡터로부터 상기 음성 신호의 유성음 고주파 에너지를 추정하는 유성음 모델부;상기 특징 벡터로부터 상기 음성 신호의 무성음 고주파 에너지를 추정하는 무성음 모델부;상기 특징 벡터로부터 상기 음성 신호가 유성음일 확률 또는 무성음일 확률을 추정하는 성음 분류부;상기 유성음일 확률 또는 무성음일 확률에 기초하여 상기 유성음 고주파 에너지 및 상기 무성음 고주파 에너지를 합성하여 상기 음성 신호의 고주파 에너지를 계산하는 에너지 계산부; 및상기 계산된 고주파 에너지를 기초로 상기 음성 신호의 고주파 신호를 복원하는 복원부를 포함하고, 상기 유성음 모델부 및 상기 무성음 모델부의 각각은,n개의 신경망(n은 2 이상의 자연수)을 포함하고,상기 n개의 신경망은 상기 특징 벡터를 입력받으면서, 상기 n개의 신경망 중 i+1번째(i는 1부터 n-1) 신경망은 i번째 신경망의 출력을 입력받도록 학습되고, 상기 i번째 신경망은 상기 음성 신호와 관련된 제1 고주파 대역에 대한 에너지를 출력하고, 상기 i+1번째 신경망은 상기 음성 신호와 관련된 제2 고주파 대역에 대한 에너지를 출력하며,상기 제1 고주파 대역은 상기 제2 고주파 대역에 포함되는 음성 신호 대역폭 확장 장치
|
2 |
2
제1항에 있어서,상기 특징 벡터 추출부는, 상기 음성 신호를 푸리에 변환한 후 로그-파워를 적용하여 상기 특징 벡터를 추출하는음성 신호 대역폭 확장 장치
|
3 |
3
제1항에 있어서,상기 유성음 모델부 및 상기 무성음 모델부의 각각은,상기 특징 벡터로부터 상기 음성 신호에서 잡음을 제거한 음성 신호의 특징 벡터를 출력하는 디노이징 신경망을 포함하고,상기 유성음 모델부는, 상기 잡음을 제거한 음성신호의 특징 벡터로부터 상기 음성 신호의 유성음 고주파 에너지를 추정하고, 상기 무성음 모델부는,상기 잡음을 제거한 특징 벡터로부터 상기 음성 신호의 무성음 고주파 에너지를 추정하는음성 신호 대역폭 확장 장치
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 i+1번째 신경망에서 출력되는 에너지는, 상기 i번째 신경망에서 출력되는 에너지를 포함하고,상기 유성음 모델부의 n번째 신경망은 상기 유성음 고주파 에너지를 출력하고, 상기 무성음 모델부의 n번째 신경망은 상기 무성음 고주파 에너지를 출력하는음성 신호 대역폭 확장 장치
|
6 |
6
제1항에 있어서,상기 에너지 계산부는, [수학식 1](상기 는 상기 유성음일 확률, 상기 는 상기 유성음 고주파 에너지, 상기 는 상기 무성음 고주파 에너지, 상기 는 상기 음성 신호의 고주파 에너지)을 통해 상기 음성 신호의 고주파 에너지 를 계산하는음성 신호 대역폭 확장 장치
|
7 |
7
제1항에 있어서,상기 복원부는,상기 음성 신호의 고주파 대역을 복수의 부분 대역으로 나누었을 때, 상기 음성 신호의 저주파 에너지를 폴딩시킨 폴딩 에너지의 상기 복수의 부분 대역별 평균 값과, 상기 계산된 고주파 에너지의 상기 복수의 부분 대역별 평균 값의 차이를 기초로 상기 폴딩 에너지를 보정하여 상기 고주파 대역의 에너지를 복원하는음성 신호 대역폭 확장 장치
|
8 |
8
제7항에 있어서,상기 복원부는,상기 음성 신호의 저주파 대역의 위상을 점대칭하여 상기 고주파 대역의 위상을 복원하고, 상기 복원된 고주파 대역의 에너지 및 상기 복원된 고주파 대역의 위상을 기초로 상기 음성 신호의 고주파 신호를 복원하는음성 신호 대역폭 확장 장치
|
9 |
9
음성 신호 대역폭 확장 방법에 있어서 상기 방법은 하나 이상의 프로세서에 의해 수행되고, 상기 방법은,음성 신호로부터 특징 벡터를 추출하는 단계;상기 특징 벡터로부터 상기 음성 신호의 유성음 고주파 에너지를 추정하는 단계;상기 특징 벡터로부터 상기 음성 신호의 무성음 고주파 에너지를 추정하는 단계;상기 특징 벡터로부터 상기 음성 신호가 유성음일 확률 또는 무성음일 확률을 추정하는 단계;상기 유성음일 확률 또는 무성음일 확률에 기초하여 상기 유성음 고주파 에너지 및 상기 무성음 고주파 에너지를 합성하여 상기 음성 신호의 고주파 에너지를 계산하는 단계; 및상기 계산된 고주파 에너지를 기초로 상기 음성 신호의 고주파 신호를 복원하는 단계를 포함하고, 상기 유성음 고주파 에너지를 추정하는 단계 및 상기 무성음 고주파 에너지를 추정하는 단계는 n개의 신경망(n은 2 이상의 자연수)을 통해 각각 상기 유성음 고주파 에너지 및 상기 무성음 고주파 에너지를 추정하고,상기 n개의 신경망은 상기 특징 벡터를 입력 받으면서, 상기 n개의 신경망 중 i+1번째(i는 1부터 n-1) 신경망은 i번째 신경망의 출력을 입력 받도록 학습되고, 상기 i번째 신경망은 상기 음성 신호와 관련된 제1 고주파 대역에 대한 에너지를 출력하고, 상기 i+1번째 신경망은 상기 음성 신호와 관련된 제2 고주파 대역에 대한 에너지를 출력하며,상기 제1 고주파 대역은 상기 제2 고주파 대역에 포함되는 음성 신호 대역폭 확장 방법
|
10 |
10
음성 신호로부터 특징 벡터를 추출하는 단계;상기 특징 벡터로부터 상기 음성 신호의 유성음 고주파 에너지를 추정하는 단계;상기 특징 벡터로부터 상기 음성 신호의 무성음 고주파 에너지를 추정하는 단계;상기 특징 벡터로부터 상기 음성 신호가 유성음일 확률 또는 무성음일 확률을 추정하는 단계;상기 유성음일 확률 또는 무성음일 확률에 기초하여 상기 유성음 고주파 에너지 및 상기 무성음 고주파 에너지를 합성하여 상기 음성 신호의 고주파 에너지를 계산하는 단계; 및상기 계산된 고주파 에너지를 기초로 상기 음성 신호의 고주파 신호를 복원하는 단계를 프로세서로 하여금 수행하게 하는 명령어를 포함하고, 상기 유성음 고주파 에너지를 추정하는 단계 및 상기 무성음 고주파 에너지를 추정하는 단계는 n개의 신경망(n은 2 이상의 자연수)을 통해 각각 상기 유성음 고주파 에너지 및 상기 무성음 고주파 에너지를 추정하고,상기 n개의 신경망은 상기 특징 벡터를 입력 받으면서, 상기 n개의 신경망 중 i+1번째(i는 1부터 n-1) 신경망은 i번째 신경망의 출력을 입력 받도록 학습되고, 상기 i번째 신경망은 상기 음성 신호와 관련된 제1 고주파 대역에 대한 에너지를 출력하고, 상기 i+1번째 신경망은 상기 음성 신호와 관련된 제2 고주파 대역에 대한 에너지를 출력하며,상기 제1 고주파 대역은 상기 제2 고주파 대역에 포함되는 프로그램이 기록된 컴퓨터 판독 가능 기록매체
|