1 |
1
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 단계;상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 단계;상기 음성 신호의 잡음 코드북을 선정하는 단계;상기 음성 신호의 클린 음성 코드북을 선정하는 단계;상기 음성 부존재 확률을 통해 잡음의 클린 음성 부존재시의 게인과 클린 음성 존재시의 게인을 산출하는 단계;상기 음성 부존재 확률을 통해 클린 음성과 잡음의 스펙트럼 형태와 게인을 포함하는 파라미터 세트를 정하는 단계;상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하는 단계;상기 선정된 최대 유사도 값을 기초로 바이너(wiener) 필터링을 이용하여 잡음을 제거하는 단계; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 단계; 를 포함하고,상기 잡음 코드북과 상기 클린 음성 코드북 선정 단계는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 바이너리 모델 산정 단계는, 상기 입력된 음성 신호에 클린 음성이 없는 잡음만 존재하는 음성 부존재 추정 모델과, 상기 입력된 음성 신호에 클린 음성과 잡음이 존재하는 음성 존재 추정 모델로 구분되며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 P(H0 | y)와 P(H1 | y)는 MS, WSA, IMCRA 를 포함하는 잡음 추정 알고리즘 중 어느 한 알고리즘을 통해 계산된 이전 및 상기 이전의 이전 SNR 값을 이용하여 추정하는 것을 특징으로 하는 음성 향상 방법
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 방법
|
4 |
4
제 1 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 방법을 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이며상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되며,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 값을 파라미터 세트를 선정하는 단계는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너(wiener) 필터링 단계는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 방법
|
5 |
5
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 단계;상기 음성 부존재 확률에 대한 바이너리 추정 모델을 기반으로 상기 음성 신호의 클린 음성 및 잡음 스펙트럼 형태를 구하는 단계; 및상기 음성 신호에 대하여 상기 바이너리 추정 모델을 기반으로 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 상기 클린 음성 부존재 시의 게인과 상기 클린 음성 존재시의 게인을 최대 유사도 산정을 통해 별도로 결정하는 단계;상기 클린 음성 및 잡음의 스펙트럼 형태 및 게인들을 이용하여 CDSTP를 위한 최소 평균 제곱 오류(MMSE) 추정을 통해 잡음을 제거하는 단계;상기 CDSTP를 위한 최소 평균 제곱 오류 추정은 상기 입력된 음성 신호와 유사한 잡음과 클린 음성의 코드북을 산정하고 상기 산정된 코드북을 이용하여 상기 클린 음성 및 잡음의 형태 및 게인을 포함하는 파라미터 세트를 산출하는 단계;를 포함하며,상기 잡음 코드북과 상기 클린 음성 코드북 선정 단계는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 방법
|
6 |
6
삭제
|
7 |
7
제 5 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 방법을 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이고,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되는 것을 특징으로 하는 음성 향상 방법
|
8 |
8
제 7 항에 있어서,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하는 단계는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너(wiener) 필터링 단계는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 방법
|
9 |
9
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 장치에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 FFT 부;상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 SAP 모델링부;상기 음성 신호의 잡음 코드북을 선정하는 잡음 코드 벡터 선정부;상기 음성 신호의 클린 음성 코드북을 선정하는 클린 음성 코드 벡터 선정부;상기 음성 부존재 확률을 통해 잡음의 클린 음성 부존재 시의 게인과 클린 음성 존재시의 게인을 산출하고, 상기 음성 부존재 확률을 통해 클린 음성과 잡음의 스펙트럼 형태와 게인을 파라미터 세트를 정하고 이중 최대 유사도를 갖는 파라미터 세트 값을 선정하는 게인 추정 및 최적 파라미터 선정부;상기 선정된 최대 유사도 값을 기초로 바이너(wiener) 필터링을 이용하여 잡음을 제거하는 바이너 필터링부; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 IFFT부;를 포함하고,상기 잡음 코드 벡터 선정부와 상기 클린 음성 코드 벡터 선정부는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 SAP 모델링부는, 상기 입력된 음성 신호에 클린 음성이 없는 잡음만 존재하는 음성 부존재 추정 모델과, 상기 입력된 음성 신호에 클린 음성과 잡음이 존재하는 음성 존재 추정 모델로 구분하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 P(H0 | y)와 P(H1 | y)는 MS, WSA, IMCRA 를 포함하는 잡음 추정 알고리즘 중 어느 한 알고리즘을 통해 계산된 이전 및 상기 이전의 이전 SNR 값을 이용하여 추정하는 것을 특징으로 하는 음성 향상 장치
|
10 |
10
삭제
|
11 |
11
제 9 항에 있어서,상기 잡음 코드 벡터 선정부 및 상기 클린 음성 코드 벡터 선정부는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 장치
|
12 |
12
제 9 항에 있어서,상기 잡음 코드 벡터 선정부 및 상기 클린 음성 코드 벡터 선정부는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 장치를 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이며,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되며,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 게인 추정 및 최적 파라미터 선정부는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 상기 바이너 필터링부는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 장치
|
13 |
13
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 장치에 있어서,입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 SAP 모델링부;상기 음성 부존재 확률에 대한 바이너리 추정 모델을 기반으로 상기 음성 신호의 클린 음성 및 잡음 스펙트럼 형태를 구하는 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부; 및상기 음성 신호에 대하여 상기 바이너리 추정 모델을 기반으로 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 상기 클린 음성 부존재 시의 게인과 상기 클린 음성 존재시의 게인을 최대 유사도 산정을 통해 별도로 결정하는 게인 추정 및 최적 파라미터 선정부를 포함하며,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는,잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는 상기 클린 음성 및 잡음의 스펙트럼 형태 및 게인들을 이용하여 CDSTP를 위한 최소 평균 제곱 오류(MMSE) 추정을 통해 선정하고, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하고상기 게인 추정 및 최적 파라미터 선정부는, 상기 CDSTP를 위한 최소 평균 제곱 오류 추정은 상기 입력된 음성 신호와 유사한 잡음과 클린 음성의 코드북을 산정하고 상기 산정된 코드북을 이용하여 상기 클린 음성 및 잡음의 형태 및 게인을 포함하는 파라미터 세트를 산출하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되며,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 장치
|
14 |
14
삭제
|
15 |
15
제 13 항에 있어서,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 장치를 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항인 것을 특징으로 하는 음성 향상 장치
|
16 |
16
제 15 항에 있어서,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되고,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되며,상기 게인 추정 및 최적 파라미터 선정부는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너 필터링부는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 장치
|