1 |
1
(a) 적어도 둘 이상의 마이크를 포함하는 다중 마이크로폰을 통해 타겟 음원신호와 잡음 및 반향 신호가 혼합된 신호를 입력받는 단계;(b) 상기 입력된 신호들을 이용하여 타겟 음원과 잡음원에 대한 정보를 반영하는 분산도를 기반으로 하는 마스크를 생성하는 단계;(c) 상기 생성된 마스크를 이용하여 다중 마이크로폰으로의 입력 신호를 전처리하는 단계;(d) 상기 전처리된 입력 신호에 대하여 사전 설정된 알고리즘을 수행하여 타겟 음원에 대한 방향을 추정하는 단계;를 구비하고, 상기 (b) 마스크를 생성하는 단계는, 입력 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성(Coherence) 및 분산도(Diffuseness)를 이용하여 마스크를 생성하는 것을 특징으로 하는 음원 국지화 방법
|
2 |
2
제1항에 있어서
|
3 |
3
제2항에 있어서, 상기 (c) 입력 신호를 전처리하는 단계는,이진화 마스크를 이용하여 입력 신호를 이진화시키는 것을 특징으로 하는 음원 국지화 방법
|
4 |
4
제1항에 있어서, 상기 (d) 단계의 사전 설정된 알고리즘은 일반화된 교차 상관(Generalized Cross-correlation;'GCC')값을 기반으로 한 음원 국지화 방법이거나 Steered Response Power('SRP')를 기반으로 한 음원 국지화 방법인 것을 특징으로 하는 음원 국지화 방법
|
5 |
5
제4항에 있어서, 상기 알고리즘들은 각 주파수의 신호들에 대하여 아래의 수학식에 따른 가중치(Ψ(ω))를 부가하는 Phase Transform('PHAT") 방식을 적용하는 것을 특징으로 하는 음원 국지화 방법
|
6 |
6
제2항에 있어서, 각 주파수(f) 및 시간 프레임(l)에 대한 CDR(l,f)은 잡음(n), 타겟 음원 신호(s) 및 잡음과 타겟 음원 신호의 혼합 신호(x)에 대한 일관성들을 이용하여 아래의 수학식에 따라 추정되는 것을 특징으로 하는 음원 국지화 방법
|
7 |
7
제2항에 있어서, 상기 분산도(D(l,f))는 아래의 수학식에 따라 계산되는 것을 특징으로 하는 음원 국지화 방법
|
8 |
8
다중 마이크로폰과 연결되어 다중 마이크로폰으로부터 타겟 음원 신호와 잡음 및 반향 신호가 혼합된 신호를 입력받는 혼합 신호 입력 모듈; 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호를 이용하여 분산도를 기반으로 한 이진화 마스크를 생성하여 출력하는 마스크 생성 모듈; 상기 마스크 생성 모듈로부터 이진화 마스크를 제공받고, 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호에 대하여 이진화 마스크를 적용하여 혼합 신호를 전처리하여 출력하는 입력 신호 전처리 모듈; 상기 입력 신호 전처리 모듈로부터 전처리된 혼합 신호를 제공받고, 상기 혼합 신호에 대하여 사전 설정된 국지화 알고리을 수행하여 타겟 음원에 대한 방향을 추정하여 출력하는 타겟 방향 추정 모듈; 을 구비하여, 다중 마이크로폰으로부터 입력되는 신호들을 이용하여 타겟 음원의 방향을 추정하는 것을 특징으로 하며,상기 마스크 생성 모듈은,상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성(Coherence) 및 분산도(Diffuseness)를 이용하여 마스크를 생성하는 것을 특징으로 하는 음원 국지화 장치
|
9 |
9
제8항에 있어서, 상기 마스크 생성 모듈은, 상기 혼합 신호 입력 모듈로부터 제공된 혼합 신호의 각 주파수(f) 및 시간 프레임(l)에 대한 일관성 대 분산도의 비(Coherence to Diffuseness ratio) (CDR(l,f))을 계산하고, 상기 CDR(l,f) 을 이용하여 분산도(D(l,f))를 계산하고, 상기 분산도(D(l,f))를 이용하여 아래의 수학식에 따라 마스크(MASk)값을 설정하여 이진화 마스크(M)을 생성하는 것을 특징으로 하는 음원 국지화 장치
|
10 |
10
제8항에 있어서, 상기 타겟 방향 추정 모듈의 사전 설정된 국지화 알고리즘은 일반화된 교차 상관(Generalized Cross-correlation;'GCC')값을 기반으로 한 음원 국지화 방법이거나 Steered Response Power('SRP')를 기반으로 한 음원 국지화 방법인 것을 특징으로 하는 음원 국지화 장치
|
11 |
11
제9항에 있어서, 각 주파수(f) 및 시간 프레임(l)에 대한 CDR(l,f)은 잡음(n), 타겟 음원 신호(s) 및 잡음과 타겟 음원 신호의 혼합 신호(x)에 대한 일관성들을 이용하여 아래의 수학식에 따라 추정되는 것을 특징으로 하는 음원 국지화 장치
|