맞춤기술찾기

이전대상기술

비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법 및 시스템

  • 기술번호 : KST2015136657
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음향 개선 방법 및 시스템에 관한 것으로서, 보다 구체적으로는 (1) 잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출하는 단계; (2) 비음수 행렬 인수분해(NMF)에 기반하여 상기 제1 신호로부터 얻은 값을 이용하여 신호대 잡음비(SNR) 값을 추정하며, 상기 추정된 신호대 잡음비(SNR) 값을 이용하여 MMSE-LSA 이득함수를 구함으로써, 제2 신호를 도출하는 단계; 및 (3) 상기 단계 (2)에서 도출된 제2 신호를 이용하여, 다음 시간 프레임에서 수행되는 상기 단계 (2)의 비음수 행렬 인수분해에 사용할 기저(basis) 행렬을 업데이트하는 단계를 포함하는 것을 그 구성상의 특징으로 한다.본 발명에서 제안하고 있는 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법 및 시스템에 따르면, 잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출한 후에, 비음수 행렬 인수분해(NMF)에 기반하여 제1 신호로부터 추정된 음성과 노이즈(제1 신호로부터 얻은 값)를 바탕으로 사전 신호대 잡음비(SNR) 값과 사후 신호대 잡음비(SNR) 값을 구하고, MMSE-LSA 이득함수를 이용하여 제2 신호를 도출함으로써, 높은 성능의 음향 향상 기능을 가진다.또한, 본 발명에 따르면, 제2 신호를 이용하여 다음 시간 프레임에서 수행되는 비음수 행렬 인수분해에 사용할 기저 행렬을 업데이트함으로써, 올바른 잡음 모델을 초깃값으로 유지할 수 있고, 음성 존재 확률 값(SPP) 추정을 통한 업데이트 속도 결정하도록 하여 잡음 환경 변화 속도에 따라 업데이트 비율을 자동으로 계산하여 적용함으로써, 불필요하게 많은 업데이트로 인한 오버피팅(overfitting) 등의 악영향을 끼지는 것을 방지할 수 있다.뿐만 아니라, 본 발명에 따르면, MMSE-LSA 이득함수 이용함으로써, 종래 위너(Weiner) 필터 형태의 이득함수를 이용하는 것보다 안정적인 성능을 이끌어낼 수 있으며, 음성과 잡음의 크기가 따로 추정되어 구해지므로 종래 Decision Directe(DD)기법을 사용하여 잡음과 음성의 파워를 추정하는 것이 아닌 단순한 스무딩 기술(Smoothing technique)을 사용하여 개별적인 파워를 사용함으로써, 음향 개선 효과를 더욱 향상시킬 수 있다.
Int. CL G10L 21/02 (2006.01.01)
CPC G10L 21/02(2013.01)
출원번호/일자 1020130168578 (2013.12.31)
출원인 서울대학교산학협력단
등록번호/일자 10-1535135-0000 (2015.07.02)
공개번호/일자 10-2015-0078831 (2015.07.08) 문서열기
공고번호/일자 (20150724) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.12.31)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남수 대한민국 서울특별시 서초구
2 권기수 대한민국 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울특별시 금천구 가산디지털*로 ***, 에이동 ***호 특허그룹덕원 (가산동, 우림 라이온스밸리)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.12.31 수리 (Accepted) 1-1-2013-1211454-73
2 보정요구서
Request for Amendment
2014.01.16 발송처리완료 (Completion of Transmission) 1-5-2014-0007605-90
3 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2014.01.24 수리 (Accepted) 1-1-2014-0073839-54
4 의견제출통지서
Notification of reason for refusal
2014.12.26 발송처리완료 (Completion of Transmission) 9-5-2014-0887763-44
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.02.03 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0117506-11
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.03.17 수리 (Accepted) 4-1-2015-5033829-92
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.05.13 수리 (Accepted) 4-1-2015-5062924-01
8 등록결정서
Decision to grant
2015.06.25 발송처리완료 (Completion of Transmission) 9-5-2015-0426911-16
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
비음수 행렬 인수분해를 이용한 음향 개선 방법으로서,(1) 잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출하는 단계;(2) 비음수 행렬 인수분해(NMF)에 기반하여 상기 제1 신호로부터 얻은 값을 이용하여 신호대 잡음비(SNR) 값을 추정하며, 상기 추정된 신호대 잡음비(SNR) 값을 이용하여 MMSE-LSA 이득함수를 구함으로써, 제2 신호를 도출하는 단계; 및(3) 상기 단계 (2)에서 도출된 제2 신호를 이용하여, 다음 시간 프레임에서 수행되는 상기 단계 (2)의 비음수 행렬 인수분해에 사용할 기저(basis) 행렬을 업데이트하는 단계를 포함하며,상기 단계 (3)은,(3-1) 상기 제2 신호를 이용하여 미리 정해진 주파수 빈(Frequency bin)에서의 음성 존재 확률 값(SPP)을 추정하는 단계; 및(3-2) 상기 음성 존재 확률 값을 이용하여 상기 기저 행렬을 업데이트하는 속도를 결정하는 단계를 포함하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법
2 2
제1항에 있어서, 상기 단계 (2)는,(2-1) 상기 제1 신호의 절댓값을 구하고, 사전에 미리 트레이닝된 잡음 기저 행렬과 음성 기저 행렬을 통하여 부호화 행렬을 추정하는 단계;(2-2) 상기 단계 (2-1)에서 추정된 부호화 행렬과, 이전 시간 프레임의 상기 단계 (3)에서 업데이트된 기저 행렬을 이용하여 사전 신호대 잡음비(SNR) 값과 사후 신호대 잡음비(SNR) 값을 추정하는 단계; 및(2-3) 상기 단계 (2-2)에서 추정된 신호대 잡음비(SNR) 값들과 MMSE-LSA 이득함수 이용하여 제2 신호를 도출하는 단계를 포함하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법
3 3
제1항에 있어서, 상기 단계 (2)는,상기 신호대 잡음비(SNR) 값을 추정하기 위하여 스무딩 기술(Smoothing technique)을 시행하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법
4 4
제1항에 있어서, 상기 단계 (3)은,잡음 및 음성 모델 모두를 동시에 매 프레임에서 업데이트하되, 주파수 별로 개별적으로 연산하여 업데이트하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법
5 5
삭제
6 6
제1항에 있어서, 상기 단계 (3-2)는,복원 에러(reconstruction error)를 지표로 사용하고 시그모이드 함수(sigmoid function)를 사용하여 연산하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 방법
7 7
비음수 행렬 인수분해를 이용한 음향 개선 시스템으로서,잡음과 음성이 섞인 음향 신호를 통계적 모델 기반의 음향 개선 기법을 이용하여 복소수 값으로 변환한 제1 신호(pre-enhanced signal)를 도출하는 제1 신호 도출 모듈;비음수 행렬 인수분해(NMF)에 기반하여 상기 제1 신호로부터 얻은 값을 이용하여 신호대 잡음비(SNR) 값을 추정하며, 상기 추정된 신호대 잡음비(SNR) 값을 이용하여 MMSE-LSA 이득함수를 구함으로써, 제2 신호를 도출하는 제2 신호 도출 모듈; 및상기 제2 신호를 이용하여, 다음 시간 프레임에서 수행되는 비음수 행렬 인수분해에 사용할 기저(basis) 행렬을 업데이트하는 기저 행렬 업데이트 모듈을 포함하며,상기 기저 행렬 업데이트 모듈은,상기 제2 신호를 이용하여 미리 정해진 주파수 빈(Frequency bin)에서의 음성 존재 확률 값(SPP)을 추정하는 SPP 추정모듈; 및상기 음성 존재 확률 값을 이용하여 상기 기저 행렬을 업데이트하는 속도를 결정하는 업데이트 속도 결정모듈을 포함하는 것을 특징으로 하는, 비음수 행렬 인수분해 및 기저 행렬 업데이트를 이용한 음향 개선 시스템
8 8
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 서울대학교 산학협력단 대학 IT 연구센터 육성지원사업(ITRC) 실감 오케스트라 서비스를 위한 입체음향 취득/재현기술 개발