맞춤기술찾기

이전대상기술

음성과 잡음 신호 분리 방법 및 그 장치

  • 기술번호 : KST2015084370
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 음성과 잡음 신호 분리 방법 및 그 장치에 관한 것으로, 음원의 통계적 정보를 이용하는 음원 분리 기술과 음원의 공간적 정보를 활용하는 빔포밍 기술을 두개 이상의 마이크로폰을 갖춘 시스템에 사용할 경우 음성 신호와 잡음 신호를 보다 효과적으로 분리할 수 있게 되며, 결과적으로 잡음 환경에서 녹음된 신호로부터 잡음신호가 제거된 깨끗한 음성 신호를 추출할 수 있다. 또한, 본 발명은 암묵 신호 분리 기술에 있어서 학습 과정이 불필요하므로 계산량이 적고 잘못된 학습으로 인한 성능 저하의 염려가 없는 등, 음원 분리의 성능을 높일 뿐만 아니라 동시에 가중치 학습 단계에서 수렴 속도를 높임으로서 계산 효율성도 제고할 수 있으며, 빔포밍 기술의 경우에도 일반적으로 알려지지 않은 잡음원의 개수 및 위치에 관계없이 환경에 강인하게 동작할 수 있다. 빔포머, 음원, 분리, 마이크로폰, 잡음
Int. CL G10L 99/00 (2009.01)
CPC G10L 21/0272(2013.01) G10L 21/0272(2013.01) G10L 21/0272(2013.01) G10L 21/0272(2013.01)
출원번호/일자 1020080125433 (2008.12.10)
출원인 한국전자통신연구원
등록번호/일자 10-1082840-0000 (2011.11.07)
공개번호/일자 10-2010-0066916 (2010.06.18) 문서열기
공고번호/일자 (20111111) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 접수/방식완료
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.12.10)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박기영 대한민국 대전광역시 유성구
2 이성주 대한민국 충청남도 계룡시
3 강병옥 대한민국 대전광역시 유성구
4 정호영 대한민국 대전광역시 서구
5 이윤근 대한민국 대전 서구
6 박전규 대한민국 서울특별시 금천구
7 강점자 대한민국 대전광역시 서구
8 정훈 대한민국 강원도 홍천군
9 김종진 대한민국 대전광역시 서구
10 정의석 대한민국 대전광역시 유성구
11 전형배 대한민국 대전광역시 서구
12 왕지현 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 (주)로하 부산광역시 해운대구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.12.10 수리 (Accepted) 1-1-2008-0851148-54
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
3 의견제출통지서
Notification of reason for refusal
2011.02.08 발송처리완료 (Completion of Transmission) 9-5-2011-0068259-08
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.04.08 수리 (Accepted) 1-1-2011-0258130-27
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.04.08 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0258131-73
6 등록결정서
Decision to grant
2011.10.28 발송처리완료 (Completion of Transmission) 9-5-2011-0628345-17
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
한 개 이상의 음원이 존재하는 환경에서 사용자에 의해 발성된 음성 신호 및 잡음 신호를 녹음하는 단계와, 상기 녹음된 음성 신호 및 잡음 신호에 대하여 빔포밍 과정을 통해 공간적으로 신호 분리하는 단계와, 상기 빔포밍 과정을 거친 신호에 대한 암묵 처리 분리 과정을 통해 통계적으로 신호 분리하여 출력하는 단계를 포함하며, 상기 공간적으로 분리하는 단계는, 2개의 출력 중에서 하나의 출력에는 설정된 각도에 1의 이득을 주도록 가중치를 결정하고, 나머지 1개의 출력에는 상기 설정된 각도에 0의 이득을 주도록 상기 가중치를 결정하는 음성과 잡음 신호 분리 방법
2 2
제 1 항에 있어서, 상기 빔포밍 과정은, 수학식 1 (여기서, wij는 j-번째 마이크로폰의 입력과 i-번째 빔포밍 출력을 연결하는 복소수 가중치 벡터이고, xj(n)은 j-번째 마이크로폰으로부터의 시간 에서의 입력 신호 벡터이며, × xj(n)는 컨볼루션 연산을 의미한다
3 3
제 2 항에 있어서, 상기 wij는, 수학식 2 와 수학식 3 (여기서, wi는 빔포머의 i-번째 출력을 계산하기 위한 가중치 벡터이고, w는 빔포머의 전체 출력을 계산하기 위한 가중치 행렬이다
4 4
제 3 항에 있어서, 상기 가중치 행렬(w)은, 수학식 4 for (여기서, wi는 i-번째 빔포머 출력을 계산하기 위한 가중치 벡터이고, aH는 벡터 a의 Hermitian을 의미하고, s(φ)는 각도에 따라 결정되는 조향 벡터(steering vector)를 의미하며, g는 임의로 설정하는 이득을 의미하며, i-번째 출력이 원하는 방향의 신호를 그대로 전달하기 위해서는 g=1로, 원하는 방향의 신호를 상쇄시키기 위해서는 g=0으로 설정한다
5 5
제 4 항에 있어서, 상기 조향 벡터(s(φ))는, 수학식 5 (여기서, M은 마이크로폰의 개수이고, j는 허수이며, T는 트랜스 포즈를 의미한다
6 6
제 5 항에 있어서, 상기 φ는, 수학식 6 (여기서, φ는 음원의 방향(θ)에 따라 결정되는 값이고, d는 마이크로폰 사이의 간격이고, λ는 마이크로폰으로부터 입력되는 신호의 파장이다
7 7
제 1 항에 있어서, 상기 분리하는 단계는, 상기 녹음된 음성 신호와 잡음 신호가 입력될 경우, 2개의 출력을 갖게 되며 상기 출력을 위한 가중치 값은, 수학식 8 (여기서, w는 빔포머의 전체 출력을 계산하기 위한 가중치 행렬이고, H는 Hermitian을 의미하며, φt는 원하는 음성 신호의 방향을 나타내며, s(φ)는 각도에 따라 결정되는 조향 벡터로 M=2인 경우이다
8 8
제 7 항에 있어서, 상기 w1은 빔포머의 출력 중 음성을 포함하고 있는 출력을 계산하기 위한 가중치 벡터이고, w2는 빔포머의 출력 중 음성을 상쇄시킨 출력을 계산하기 위한 가중치 벡터로서, 수학식 9 (여기서, w는 빔포머의 전체 출력을 계산하기위한 가중치 행렬이고, T는 트랜스 포즈를 의미한다
9 9
제 8 항에 있어서, 상기 수학식 9에 의해 결정된 가중치 벡터는, 수학식 10 (여기서, x1, x2는 각각 첫 번째 및 두 번째 마이크로폰으로부터 입력된 신호를 의미한다
10 10
제 1 항에 있어서, 상기 분리하는 단계는, 상기 녹음된 음성 신호와 잡음 신호가 입력될 경우, 딜레이-앤드-섬(delay-and-sum) 빔포머를 이용하는 가중치는, 수학식 11 (여기서, di는 마이크로폰의 중점으로부터 각 마이크로폰까지의 거리이고, θ0은 원하는 음원의 방향이며, f는 신호의 주파수이며, c는 소리의 속도를 나타낸다
11 11
제 1 항에 있어서, 상기 암묵 처리 분리 과정은, 음성 방향을 제외한 나머지 영역에 대하여 균등하게 분포하는 음성 방향을 포함한 모든 방향에 대하여 마이크로폰의 전면 0∼180°를 L개의 방향으로 분할하여 0도, ,,, 개의 방향으로 설정하는 것을 특징으로 하는 음성과 잡음 신호 분리 방법
12 12
제 11 항에 있어서, 상기 L개의 방향 중 음성의 방향과 가장 가까운 각도를 음성의 방향과 동일하게 수정한 다음에, 상기 수정된 각각의 각도를 φ1, φ2,
13 13
한 개 이상의 음원이 존재하는 환경에서 사용자에 의해 발성된 음성 신호 및 잡음 신호를 녹음하는 다수의 마이크로폰과, 상기 녹음된 음성 신호 및 잡음 신호에 대하여 빔포밍 과정을 통해 공간적으로 신호 분리하는 빔포머와, 상기 빔포밍 과정을 거친 신호에 대한 암묵 처리 분리 과정을 통해 통계적으로 신호 분리하여 출력하는 음원 분리부를 포함하며, 상기 빔포머는, 2개의 출력 중에서 하나의 출력에는 설정된 각도에 1의 이득을 주도록 가중치를 결정하고, 나머지 1개의 출력에는 상기 설정된 각도에 0의 이득을 주도록 상기 가중치를 결정하는 음성과 잡음 신호 분리 장치
14 14
제 13 항에 있어서, 상기 빔포머는, 상기 다수의 마이크로폰으로부터 입력되는 상기 녹음된 음성 신호 및 잡음 신호를 공간적으로 분리하는 과정에서 사용자가 위치하는 방향에 해당하는 1개의 신호에 대하여 신호를 강화하는 것을 특징으로 하는 음성과 잡음 신호 분리 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 및 정보통신연구진흥원 한국전자통신연구원 IT 신성장동력핵심기술개발사업 신성장동력산업용 대용량 대화형 분산 처리 음성인터페이스기술개발