1 |
1
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 단계;상기 음성 신호로부터 잡음을 추정하는 단계; 상기 추정된 잡음으로부터 가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 잡음 코드북을 선정하는 단계;상기 음성 신호, 상기 선정된 잡음 코드북, 기 설정된 클린 신호 코드북을 기반으로 하여, 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 단계; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 단계;를 포함하며,상기 잡음 코드북을 선정하는 단계는,상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하는 단계;상기 가우시안 분포 조합을 이용하여 유사도들을 산출하는 단계; 및상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선정하는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
|
2 |
2
제1항에 있어서,상기 잡음 추정 단계는 VAD(Voice Activity Detection), RAA(recursive Averaging Algorithm), Minima-tracking Algorithm, MS(Minima-statistics), MCRA(Minima-controlled Recursive Algorithm), IMCRA(Improved Minima-controlled Recursive Algorithm), CDSTP(Codebook Driven short-term predictor estimation) 중 어느 하나 또는 이들의 둘 이상을 결합한 알고리즘을 이용하는 것을 특징으로 하는 음성 향상 방법
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 가우시안 분포의 조합은 하기 수학식(Ck 는 가중치 ,μk는 평균치,Σk 는 공분산 행렬)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
|
5 |
5
제4항에 있어서,상기 유사도 산출 단계는,하기 수학식(여기서, M은 가우시안 모델의 수)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
|
6 |
6
제4항에 있어서,상기 가우시안 분포의 조합 생성은 상기 음성 신호의 한 프레임에서의 음성 샘플의 수만큼의 조합을 생성하며, 상기 음성 신호의 확률밀도는 하기 수학식
|
7 |
7
제1항에 있어서,상기 잡음 제거 단계는,상기 음성 신호의 스펙트럼과 상기 클린 코드북 및 상기 잡음 코드북의 정보를 이용하여 클린 신호와 잡음 신호의 게인을 산출하는 단계;상기 산출된 게인들을 이용하여 상기 선정된 잡음 코드북의 잡음 코드벡터들과 기 설정된 클린 코드북의 클린 코드 벡터들의 조합 값들을 산출하는 단계;상기 음성 신호와 상기 산출된 조합값들의 유사도 값을 산출하는 단계; 및상기 산출된 유사도 값을 바탕으로 Wiener 필터링 과정을 통해 잡음이 제거된 향상된 음성 신호를 얻는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
|
8 |
8
제7항에 있어서,상기 조합값들의 유사도 값을 산출하는 단계는, Bayesian Estimation 을 이용하여 유사도를 얻는 것을 특징으로 하는 음성 향상 방법
|
9 |
9
제1항에 있어서,상기 잡음 코드북은 White, Volvo, Babble 잡음 코드북을 포함하는 것을 특징으로 하는 음성 향상 방법
|
10 |
10
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 잡음 코드북을 선택하는 단계; 및상기 선택된 잡음 코드북을 이용하여 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 단계;를 포함하며,상기 잡음 코드북을 선택하는 단계는,상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하는 단계;상기 가우시안 분포 조합을 이용하여 유사도들을 산출하는 단계; 및상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선택하는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
|
11 |
11
삭제
|
12 |
12
제10항에 있어서,상기 가우시안 분포의 조합은 하기 수학식(Ck 는 가중치 ,μk는 평균치,Σk 는 공분산 행렬)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
|
13 |
13
제12항에 있어서,상기 유사도 산출 단계는,하기 수학식(여기서, M은 가우시안 모델의 수)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
|
14 |
14
제12항에 있어서,상기 가우시안 분포의 조합 생성은 상기 음성 신호의 한 프레임에서의 음성 샘플의 수만큼의 조합을 생성하며, 상기 음성 신호의 확률밀도는 하기 수학식
|
15 |
15
제10항에 있어서,상기 잡음 제거 단계는,상기 음성 신호의 스펙트럼과 클린 코드북 및 상기 잡음 코드북의 정보를 이용하여 클린 신호와 잡음 신호의 게인을 산출하는 단계;상기 산출된 게인들을 이용하여 상기 선택된 잡음 코드북의 잡음 코드벡터들과 기 설정된 클린 코드북의 클린 코드 벡터들의 조합 값들을 산출하는 단계;상기 음성 신호와 상기 산출된 조합값들의 유사도 값을 산출하는 단계; 및상기 산출된 유사도 값을 바탕으로 Wiener 필터링 과정을 통해 잡음이 제거된 향상된 음성 신호를 얻는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
|
16 |
16
제15항에 있어서,상기 조합값들의 유사도 값을 산출하는 단계는, Bayesian Estimation 을 이용하여 유사도를 얻는 것을 특징으로 하는 음성 향상 방법
|
17 |
17
제10항에 있어서,상기 잡음 코드북은 White, Volvo, Babble 잡음 코드북을 포함하는 것을 특징으로 하는 음성 향상 방법
|
18 |
18
입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 인코딩부;상기 음성 신호로부터 잡음을 추정하는 잡음 추정부;가우시안 혼합 모델(Gaussian Mixture Model; GMM을 이용하여 잡음 코드북을 선택하는 GMM 잡음 코드북 선택부;상기 음성 신호, 상기 선택된 잡음 코드북 및 기 설정된 클린 신호 코드북을 이용하여 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 잡음 제거부; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 디코딩부;를 포함하며,상기 GMM 잡음 코드북 선택부는, 상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하고, 상기 가우시안 분포 조합을 이용하여 유사도들을 산출하며, 상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선택하는 것을 특징으로 하는 음성 향상 장치
|