맞춤기술찾기

이전대상기술

분산도 마스크를 이용한 음원 국지화 방법 및 음원 국지화 장치

  • 기술번호 : KST2019014607
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 분산도를 기반으로 한 마스크를 전술한 기술적 과제를 달성하기 위한 본 발명의 제1 특징에 따른 음원 국지화 방법은, (a) 적어도 둘 이상의 마이크를 포함하는 다중 마이크로폰을 통해 타겟 음원신호와 잡음 및 반향 신호가 혼합된 신호를 입력받는 단계; (b) 상기 입력된 신호들을 이용하여 타겟 음원과 잡음원에 대한 정보인 일관성 대 분산도의 비(CDR)을 이용하여 분산도를 기반으로 한 이진화 마스크를 생성하는 단계; (c) 상기 생성된 이진화 마스크를 이용하여 다중 마이크로폰으로의 입력 신호를 전처리하는 단계; (d) 상기 전처리된 입력 신호에 대하여 GCC-PHAT 또는 SRP-PHAT와 같은 사전 설정된 알고리즘을 수행하여 타겟 음원에 대한 방향을 추정하는 단계; 를 구비한다.
Int. CL G01S 3/80 (2006.01.01) G10L 21/02 (2006.01.01) H04R 3/00 (2006.01.01)
CPC G01S 3/8006(2013.01) G01S 3/8006(2013.01) G01S 3/8006(2013.01)
출원번호/일자 1020180009446 (2018.01.25)
출원인 서강대학교산학협력단
등록번호/일자 10-2088222-0000 (2020.03.06)
공개번호/일자 10-2019-0090578 (2019.08.02) 문서열기
공고번호/일자 (20200316) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.01.25)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박형민 서울특별시 강남구
2 이란 서울특별시 마포구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이지연 대한민국 서울특별시 관악구 남부순환로 ****, ***호 제니스국제특허법률사무소 (봉천동, 청동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서강대학교 산학협력단 서울특별시 마포구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.01.25 수리 (Accepted) 1-1-2018-0089189-42
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.01.22 수리 (Accepted) 4-1-2019-5014626-89
3 선행기술조사의뢰서
Request for Prior Art Search
2019.04.15 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2019.05.14 수리 (Accepted) 9-1-2019-0022960-23
5 의견제출통지서
Notification of reason for refusal
2019.07.02 발송처리완료 (Completion of Transmission) 9-5-2019-0476458-88
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.08.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0884293-19
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.08.28 수리 (Accepted) 1-1-2019-0884292-63
8 등록결정서
Decision to grant
2019.12.20 발송처리완료 (Completion of Transmission) 9-5-2019-0922807-15
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 적어도 둘 이상의 마이크를 포함하는 다중 마이크로폰을 통해 타겟 음원신호와 잡음 및 반향 신호가 혼합된 신호를 입력받는 단계;(b) 상기 입력된 신호들을 이용하여 타겟 음원과 잡음원에 대한 정보를 반영하는 분산도를 기반으로 하는 마스크를 생성하는 단계;(c) 상기 생성된 마스크를 이용하여 다중 마이크로폰으로의 입력 신호를 전처리하는 단계;(d) 상기 전처리된 입력 신호에 대하여 사전 설정된 알고리즘을 수행하여 타겟 음원에 대한 방향을 추정하는 단계;를 구비하고, 상기 (b) 마스크를 생성하는 단계는, 입력 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성(Coherence) 및 분산도(Diffuseness)를 이용하여 마스크를 생성하는 것을 특징으로 하는 음원 국지화 방법
2 2
제1항에 있어서
3 3
제2항에 있어서, 상기 (c) 입력 신호를 전처리하는 단계는,이진화 마스크를 이용하여 입력 신호를 이진화시키는 것을 특징으로 하는 음원 국지화 방법
4 4
제1항에 있어서, 상기 (d) 단계의 사전 설정된 알고리즘은 일반화된 교차 상관(Generalized Cross-correlation;'GCC')값을 기반으로 한 음원 국지화 방법이거나 Steered Response Power('SRP')를 기반으로 한 음원 국지화 방법인 것을 특징으로 하는 음원 국지화 방법
5 5
제4항에 있어서, 상기 알고리즘들은 각 주파수의 신호들에 대하여 아래의 수학식에 따른 가중치(Ψ(ω))를 부가하는 Phase Transform('PHAT") 방식을 적용하는 것을 특징으로 하는 음원 국지화 방법
6 6
제2항에 있어서, 각 주파수(f) 및 시간 프레임(l)에 대한 CDR(l,f)은 잡음(n), 타겟 음원 신호(s) 및 잡음과 타겟 음원 신호의 혼합 신호(x)에 대한 일관성들을 이용하여 아래의 수학식에 따라 추정되는 것을 특징으로 하는 음원 국지화 방법
7 7
제2항에 있어서, 상기 분산도(D(l,f))는 아래의 수학식에 따라 계산되는 것을 특징으로 하는 음원 국지화 방법
8 8
다중 마이크로폰과 연결되어 다중 마이크로폰으로부터 타겟 음원 신호와 잡음 및 반향 신호가 혼합된 신호를 입력받는 혼합 신호 입력 모듈; 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호를 이용하여 분산도를 기반으로 한 이진화 마스크를 생성하여 출력하는 마스크 생성 모듈; 상기 마스크 생성 모듈로부터 이진화 마스크를 제공받고, 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호에 대하여 이진화 마스크를 적용하여 혼합 신호를 전처리하여 출력하는 입력 신호 전처리 모듈; 상기 입력 신호 전처리 모듈로부터 전처리된 혼합 신호를 제공받고, 상기 혼합 신호에 대하여 사전 설정된 국지화 알고리을 수행하여 타겟 음원에 대한 방향을 추정하여 출력하는 타겟 방향 추정 모듈; 을 구비하여, 다중 마이크로폰으로부터 입력되는 신호들을 이용하여 타겟 음원의 방향을 추정하는 것을 특징으로 하며,상기 마스크 생성 모듈은,상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성(Coherence) 및 분산도(Diffuseness)를 이용하여 마스크를 생성하는 것을 특징으로 하는 음원 국지화 장치
9 9
제8항에 있어서, 상기 마스크 생성 모듈은, 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성 대 분산도의 비(Coherence to Diffuseness ratio) (CDR(l,f))을 계산하고, 상기 CDR(l,f) 을 이용하여 분산도(D(l,f))를 계산하고, 상기 분산도(D(l,f))를 이용하여 아래의 수학식에 따라 마스크(MASk)값을 설정하여 이진화 마스크(M)을 생성하는 것을 특징으로 하는 음원 국지화 장치
10 10
제8항에 있어서, 상기 타겟 방향 추정 모듈의 사전 설정된 국지화 알고리즘은 일반화된 교차 상관(Generalized Cross-correlation;'GCC')값을 기반으로 한 음원 국지화 방법이거나 Steered Response Power('SRP')를 기반으로 한 음원 국지화 방법인 것을 특징으로 하는 음원 국지화 장치
11 11
제9항에 있어서, 각 주파수(f) 및 시간 프레임(l)에 대한 CDR(l,f)은 잡음(n), 타겟 음원 신호(s) 및 잡음과 타겟 음원 신호의 혼합 신호(x)에 대한 일관성들을 이용하여 아래의 수학식에 따라 추정되는 것을 특징으로 하는 음원 국지화 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US10593344 US 미국 FAMILY
2 US20190228790 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US10593344 US 미국 DOCDBFAMILY
2 US2019228790 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서강대학교 산학협력단 기초연구사업(중견연구) 시청각 정보에 대한 멀티모달 딥러닝 기반의 강인한 연속음성인식 기술 개발