맞춤기술찾기

이전대상기술

음성 존재 확률을 이용한 코드북 기반 음성 향상 방법 및 그 장치

  • 기술번호 : KST2014058920
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 기존의 코드북 기반의 음성 향상 방법에 음성 존재 확률을 결합하여, 입력 신호에 음성이 존재하는 구간과 존재하지 않는 구간을 나눠 모델링하고, 이 확률 모델링을 통해, 게인 산정 및 코드북 산정을 진행한다.본 발명에 따른 음성 존재 확률을 결합한 코드북 기반 음성 향상 방법은 학습된 잡음에 대해서는 기존의 IMCRA나 CDSTP에 비해 더 좋은 성능을 보여주며 학습되지 않는 잡음에 대해서도 기존의 CDSTP에 비해 뛰어난 성능을 보여준다.
Int. CL G10L 19/00 (2006.01) G10L 21/02 (2006.01)
CPC G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01)
출원번호/일자 1020120006751 (2012.01.20)
출원인 세종대학교산학협력단
등록번호/일자 10-1327572-0000 (2013.11.04)
공개번호/일자 10-2013-0085732 (2013.07.30) 문서열기
공고번호/일자 (20131128) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2012.01.20)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 대한민국 서울특별시 광진구 능동로 *** (군

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김무영 대한민국 서울 강남구
2 이명석 대한민국 서울 구로구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인태백 대한민국 서울 금천구 가산디지털*로 *** 이노플렉스 *차 ***호

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 서울특별시 광진구 능동로 * (군
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2012.01.20 수리 (Accepted) 1-1-2012-0056076-12
2 선행기술조사의뢰서
Request for Prior Art Search
2013.03.13 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2013.04.05 수리 (Accepted) 9-1-2013-0023591-39
4 의견제출통지서
Notification of reason for refusal
2013.04.11 발송처리완료 (Completion of Transmission) 9-5-2013-0247648-23
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2013.06.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2013-0517085-93
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2013.06.11 수리 (Accepted) 1-1-2013-0517086-38
7 등록결정서
Decision to grant
2013.10.29 발송처리완료 (Completion of Transmission) 9-5-2013-0745122-78
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 단계;상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 단계;상기 음성 신호의 잡음 코드북을 선정하는 단계;상기 음성 신호의 클린 음성 코드북을 선정하는 단계;상기 음성 부존재 확률을 통해 잡음의 클린 음성 부존재시의 게인과 클린 음성 존재시의 게인을 산출하는 단계;상기 음성 부존재 확률을 통해 클린 음성과 잡음의 스펙트럼 형태와 게인을 포함하는 파라미터 세트를 정하는 단계;상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하는 단계;상기 선정된 최대 유사도 값을 기초로 바이너(wiener) 필터링을 이용하여 잡음을 제거하는 단계; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 단계; 를 포함하고,상기 잡음 코드북과 상기 클린 음성 코드북 선정 단계는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 바이너리 모델 산정 단계는, 상기 입력된 음성 신호에 클린 음성이 없는 잡음만 존재하는 음성 부존재 추정 모델과, 상기 입력된 음성 신호에 클린 음성과 잡음이 존재하는 음성 존재 추정 모델로 구분되며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 P(H0 | y)와 P(H1 | y)는 MS, WSA, IMCRA 를 포함하는 잡음 추정 알고리즘 중 어느 한 알고리즘을 통해 계산된 이전 및 상기 이전의 이전 SNR 값을 이용하여 추정하는 것을 특징으로 하는 음성 향상 방법
2 2
삭제
3 3
제 1 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 방법
4 4
제 1 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 방법을 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이며상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되며,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 값을 파라미터 세트를 선정하는 단계는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너(wiener) 필터링 단계는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 방법
5 5
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 단계;상기 음성 부존재 확률에 대한 바이너리 추정 모델을 기반으로 상기 음성 신호의 클린 음성 및 잡음 스펙트럼 형태를 구하는 단계; 및상기 음성 신호에 대하여 상기 바이너리 추정 모델을 기반으로 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 상기 클린 음성 부존재 시의 게인과 상기 클린 음성 존재시의 게인을 최대 유사도 산정을 통해 별도로 결정하는 단계;상기 클린 음성 및 잡음의 스펙트럼 형태 및 게인들을 이용하여 CDSTP를 위한 최소 평균 제곱 오류(MMSE) 추정을 통해 잡음을 제거하는 단계;상기 CDSTP를 위한 최소 평균 제곱 오류 추정은 상기 입력된 음성 신호와 유사한 잡음과 클린 음성의 코드북을 산정하고 상기 산정된 코드북을 이용하여 상기 클린 음성 및 잡음의 형태 및 게인을 포함하는 파라미터 세트를 산출하는 단계;를 포함하며,상기 잡음 코드북과 상기 클린 음성 코드북 선정 단계는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 방법
6 6
삭제
7 7
제 5 항에 있어서,상기 잡음 코드북 선정 및 상기 클린 음성 코드북 선정 단계는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 방법을 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이고,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되는 것을 특징으로 하는 음성 향상 방법
8 8
제 7 항에 있어서,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하는 단계는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너(wiener) 필터링 단계는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 방법
9 9
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 장치에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 FFT 부;상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 SAP 모델링부;상기 음성 신호의 잡음 코드북을 선정하는 잡음 코드 벡터 선정부;상기 음성 신호의 클린 음성 코드북을 선정하는 클린 음성 코드 벡터 선정부;상기 음성 부존재 확률을 통해 잡음의 클린 음성 부존재 시의 게인과 클린 음성 존재시의 게인을 산출하고, 상기 음성 부존재 확률을 통해 클린 음성과 잡음의 스펙트럼 형태와 게인을 파라미터 세트를 정하고 이중 최대 유사도를 갖는 파라미터 세트 값을 선정하는 게인 추정 및 최적 파라미터 선정부;상기 선정된 최대 유사도 값을 기초로 바이너(wiener) 필터링을 이용하여 잡음을 제거하는 바이너 필터링부; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 IFFT부;를 포함하고,상기 잡음 코드 벡터 선정부와 상기 클린 음성 코드 벡터 선정부는, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하며,상기 SAP 모델링부는, 상기 입력된 음성 신호에 클린 음성이 없는 잡음만 존재하는 음성 부존재 추정 모델과, 상기 입력된 음성 신호에 클린 음성과 잡음이 존재하는 음성 존재 추정 모델로 구분하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되고,상기 P(H0 | y)와 P(H1 | y)는 MS, WSA, IMCRA 를 포함하는 잡음 추정 알고리즘 중 어느 한 알고리즘을 통해 계산된 이전 및 상기 이전의 이전 SNR 값을 이용하여 추정하는 것을 특징으로 하는 음성 향상 장치
10 10
삭제
11 11
제 9 항에 있어서,상기 잡음 코드 벡터 선정부 및 상기 클린 음성 코드 벡터 선정부는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 장치
12 12
제 9 항에 있어서,상기 잡음 코드 벡터 선정부 및 상기 클린 음성 코드 벡터 선정부는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 장치를 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항이며,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되며,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되고,상기 게인 추정 및 최적 파라미터 선정부는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 선정되며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 상기 바이너 필터링부는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 장치
13 13
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 장치에 있어서,입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하는 음성 부존재 확률(SAP)에 대한 바이너리 추정 모델을 산정하는 SAP 모델링부;상기 음성 부존재 확률에 대한 바이너리 추정 모델을 기반으로 상기 음성 신호의 클린 음성 및 잡음 스펙트럼 형태를 구하는 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부; 및상기 음성 신호에 대하여 상기 바이너리 추정 모델을 기반으로 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 상기 클린 음성 부존재 시의 게인과 상기 클린 음성 존재시의 게인을 최대 유사도 산정을 통해 별도로 결정하는 게인 추정 및 최적 파라미터 선정부를 포함하며,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는,잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는 상기 클린 음성 및 잡음의 스펙트럼 형태 및 게인들을 이용하여 CDSTP를 위한 최소 평균 제곱 오류(MMSE) 추정을 통해 선정하고, 상기 산정된 바이너리 추정 모델을 이용하여, 상기 입력된 음성 신호에 대해서 클린 음성이 존재하는 구간과 클린 음성이 부존재하는 구간을 구분하여, 각각 연산을 진행하여 구하고상기 게인 추정 및 최적 파라미터 선정부는, 상기 CDSTP를 위한 최소 평균 제곱 오류 추정은 상기 입력된 음성 신호와 유사한 잡음과 클린 음성의 코드북을 산정하고 상기 산정된 코드북을 이용하여 상기 클린 음성 및 잡음의 형태 및 게인을 포함하는 파라미터 세트를 산출하며,상기 바이너리 모델은 하기 수학식으로 정의되며,여기서 H0 및 H1 은 각각 음성이 부존재 할 때와 음성이 존재할 때의 추정 모델이며, 추정 모델 H0 및 H1에 대한 확률 밀도 함수(PDF)는 P(H0 | y)와 P(H1 | y)로 정의되며,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는, 원 입력된 음성 신호의 스펙트럼과 상기 잡음 코드북의 코드벡터와 상기 클린 음성 코드북의 코드벡터를 이용한 합성 신호 스펙트럼의 IS-D(Itakura-Saito Distortion) 알고리즘을 통해 선정하는 것을 특징으로 하는 음성 향상 장치
14 14
삭제
15 15
제 13 항에 있어서,상기 잡음 코드 벡터 및 클린 음성 코드 벡터 선정부는, 상기 음성 부존재 확률(SAP) 아래 수학식의 기반 최소 평균 제곱 오류(Minimum Mean Square Error; MMSE) 추정 장치를 통해 선정하며,여기서 이며, 주어진 모델 H의 파라미터 세트(θ)이고 와 는 각각 클린 음성 및 잡음의 스펙트럼 형태의 항을 의미하며, 와 는 각각 클린 음성과 잡음의 게인의 항인 것을 특징으로 하는 음성 향상 장치
16 16
제 15 항에 있어서,상기 파라미터 세트는, 로 표현되며, 상기 클린 음성 및 잡음의 스펙트럼 형태는로 표현되고,상기 클린 음성과 잡음의 게인(gain) 항들(, )은, 2개의 추정 모델 H0 및 H1에 대해 각각,여기서 여기서 의 수학식을 통해 산정되며 상기 수학식에서 최대값을 갖는 와 가 각각 클린 음성 및 잡음의 게인 (, )이 되며,상기 게인 추정 및 최적 파라미터 선정부는, 최소 평균 제곱 오류 산정에 대한 아래 수학식을 통해 상기 정해진 파라미터 세트를 이용하여 최대 유사도를 갖는 파라미터 세트를 선정하며,이때,여기서, 이고,상기 최소 평균 제곱 오류 산정을 통해 얻은 추정 값이 파라미터 세트 로 계산되는 경우, 바이너 필터링부는, 하기 수학식을 통해 수행되며,여기서 와 는 각각 추정된 파라미터 세트의 클린 음성과 잡음의 형태( 및 )에 의해 구성된 LPC 스펙트럼인 것을 특징으로 하는 음성 향상 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.