맞춤기술찾기

이전대상기술

가우시안 혼합 모듈을 이용한 코드북 기반 음성 향상 방법 및 그 장치

  • 기술번호 : KST2014058916
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법이 개시된다. 본 발명에 따른 음성 향상 방법은, 가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 잡음 코드북을 선택하는 단계와 선택된 잡음 코드북을 이용하여 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 단계를 포함한다.본 발명에 따른 음성 향상 방법은 기존 잡음 코드북 선정 방법에 비해 정확도와 속도를 개선하였다.
Int. CL G10L 19/04 (2006.01) G10L 21/02 (2006.01)
CPC G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01) G10L 21/0232(2013.01)
출원번호/일자 1020110137622 (2011.12.19)
출원인 세종대학교산학협력단
등록번호/일자 10-1284507-0000 (2013.07.03)
공개번호/일자 10-2013-0070346 (2013.06.27) 문서열기
공고번호/일자 (20130716) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2011.12.19)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 대한민국 서울특별시 광진구 능동로 *** (군

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김무영 대한민국 서울특별시 강남구
2 주현호 대한민국 서울특별시 광진구 군
3 황인우 대한민국 서울특별시 광진구 군
4 변가람 대한민국 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인태백 대한민국 서울 금천구 가산디지털*로 *** 이노플렉스 *차 ***호

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 서울특별시 광진구 능동로 *** (군
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2011.12.19 수리 (Accepted) 1-1-2011-1009784-16
2 선행기술조사의뢰서
Request for Prior Art Search
2013.01.11 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2013.02.06 수리 (Accepted) 9-1-2013-0007819-89
4 의견제출통지서
Notification of reason for refusal
2013.03.20 발송처리완료 (Completion of Transmission) 9-5-2013-0186257-10
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2013.05.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2013-0441197-93
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2013.05.20 수리 (Accepted) 1-1-2013-0441181-63
7 등록결정서
Decision to grant
2013.06.28 발송처리완료 (Completion of Transmission) 9-5-2013-0452415-56
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 단계;상기 음성 신호로부터 잡음을 추정하는 단계; 상기 추정된 잡음으로부터 가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 잡음 코드북을 선정하는 단계;상기 음성 신호, 상기 선정된 잡음 코드북, 기 설정된 클린 신호 코드북을 기반으로 하여, 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 단계; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 단계;를 포함하며,상기 잡음 코드북을 선정하는 단계는,상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하는 단계;상기 가우시안 분포 조합을 이용하여 유사도들을 산출하는 단계; 및상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선정하는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
2 2
제1항에 있어서,상기 잡음 추정 단계는 VAD(Voice Activity Detection), RAA(recursive Averaging Algorithm), Minima-tracking Algorithm, MS(Minima-statistics), MCRA(Minima-controlled Recursive Algorithm), IMCRA(Improved Minima-controlled Recursive Algorithm), CDSTP(Codebook Driven short-term predictor estimation) 중 어느 하나 또는 이들의 둘 이상을 결합한 알고리즘을 이용하는 것을 특징으로 하는 음성 향상 방법
3 3
삭제
4 4
제1항에 있어서,상기 가우시안 분포의 조합은 하기 수학식(Ck 는 가중치 ,μk는 평균치,Σk 는 공분산 행렬)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
5 5
제4항에 있어서,상기 유사도 산출 단계는,하기 수학식(여기서, M은 가우시안 모델의 수)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
6 6
제4항에 있어서,상기 가우시안 분포의 조합 생성은 상기 음성 신호의 한 프레임에서의 음성 샘플의 수만큼의 조합을 생성하며, 상기 음성 신호의 확률밀도는 하기 수학식
7 7
제1항에 있어서,상기 잡음 제거 단계는,상기 음성 신호의 스펙트럼과 상기 클린 코드북 및 상기 잡음 코드북의 정보를 이용하여 클린 신호와 잡음 신호의 게인을 산출하는 단계;상기 산출된 게인들을 이용하여 상기 선정된 잡음 코드북의 잡음 코드벡터들과 기 설정된 클린 코드북의 클린 코드 벡터들의 조합 값들을 산출하는 단계;상기 음성 신호와 상기 산출된 조합값들의 유사도 값을 산출하는 단계; 및상기 산출된 유사도 값을 바탕으로 Wiener 필터링 과정을 통해 잡음이 제거된 향상된 음성 신호를 얻는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
8 8
제7항에 있어서,상기 조합값들의 유사도 값을 산출하는 단계는, Bayesian Estimation 을 이용하여 유사도를 얻는 것을 특징으로 하는 음성 향상 방법
9 9
제1항에 있어서,상기 잡음 코드북은 White, Volvo, Babble 잡음 코드북을 포함하는 것을 특징으로 하는 음성 향상 방법
10 10
잡음을 포함하는 음성 신호에서 잡음을 제거하는 음성 향상 방법에 있어서,가우시안 혼합 모델(Gaussian Mixture Model; GMM)을 이용하여 잡음 코드북을 선택하는 단계; 및상기 선택된 잡음 코드북을 이용하여 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 단계;를 포함하며,상기 잡음 코드북을 선택하는 단계는,상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하는 단계;상기 가우시안 분포 조합을 이용하여 유사도들을 산출하는 단계; 및상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선택하는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
11 11
삭제
12 12
제10항에 있어서,상기 가우시안 분포의 조합은 하기 수학식(Ck 는 가중치 ,μk는 평균치,Σk 는 공분산 행렬)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
13 13
제12항에 있어서,상기 유사도 산출 단계는,하기 수학식(여기서, M은 가우시안 모델의 수)을 이용하여 산출하는 것을 특징으로 하는 음성 향상 방법
14 14
제12항에 있어서,상기 가우시안 분포의 조합 생성은 상기 음성 신호의 한 프레임에서의 음성 샘플의 수만큼의 조합을 생성하며, 상기 음성 신호의 확률밀도는 하기 수학식
15 15
제10항에 있어서,상기 잡음 제거 단계는,상기 음성 신호의 스펙트럼과 클린 코드북 및 상기 잡음 코드북의 정보를 이용하여 클린 신호와 잡음 신호의 게인을 산출하는 단계;상기 산출된 게인들을 이용하여 상기 선택된 잡음 코드북의 잡음 코드벡터들과 기 설정된 클린 코드북의 클린 코드 벡터들의 조합 값들을 산출하는 단계;상기 음성 신호와 상기 산출된 조합값들의 유사도 값을 산출하는 단계; 및상기 산출된 유사도 값을 바탕으로 Wiener 필터링 과정을 통해 잡음이 제거된 향상된 음성 신호를 얻는 단계;를 포함하는 것을 특징으로 하는 음성 향상 방법
16 16
제15항에 있어서,상기 조합값들의 유사도 값을 산출하는 단계는, Bayesian Estimation 을 이용하여 유사도를 얻는 것을 특징으로 하는 음성 향상 방법
17 17
제10항에 있어서,상기 잡음 코드북은 White, Volvo, Babble 잡음 코드북을 포함하는 것을 특징으로 하는 음성 향상 방법
18 18
입력된 음성 신호를 시간 영역 신호에서 주파수 영역 신호로 변환시키는 인코딩부;상기 음성 신호로부터 잡음을 추정하는 잡음 추정부;가우시안 혼합 모델(Gaussian Mixture Model; GMM을 이용하여 잡음 코드북을 선택하는 GMM 잡음 코드북 선택부;상기 음성 신호, 상기 선택된 잡음 코드북 및 기 설정된 클린 신호 코드북을 이용하여 단기 예측계수 코드북 기법(Codebook Driven Short-Term Predictor parameter estimation; CDSTP)을 이용하여 잡음을 제거하는 잡음 제거부; 및상기 잡음이 제거된 음성 신호를 시간 영역 신호로 변환시키는 디코딩부;를 포함하며,상기 GMM 잡음 코드북 선택부는, 상기 음성 신호의 확률 분포 함수를 가우시안 분포의 조합으로 생성하고, 상기 가우시안 분포 조합을 이용하여 유사도들을 산출하며, 상기 산출된 유사도 중 가장 큰 유사도를 갖는 모델을 잡음 코드북 모델로 선택하는 것을 특징으로 하는 음성 향상 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.