1 |
1
한 개 이상의 음원이 존재하는 환경에서 사용자에 의해 발성된 음성 신호 및 잡음 신호를 녹음하는 단계와,
상기 녹음된 음성 신호 및 잡음 신호에 대하여 빔포밍 과정을 통해 공간적으로 신호 분리하는 단계와,
상기 빔포밍 과정을 거친 신호에 대한 암묵 처리 분리 과정을 통해 통계적으로 신호 분리하여 출력하는 단계를 포함하며,
상기 공간적으로 분리하는 단계는, 2개의 출력 중에서 하나의 출력에는 설정된 각도에 1의 이득을 주도록 가중치를 결정하고, 나머지 1개의 출력에는 상기 설정된 각도에 0의 이득을 주도록 상기 가중치를 결정하는
음성과 잡음 신호 분리 방법
|
2 |
2
제 1 항에 있어서,
상기 빔포밍 과정은,
수학식 1
(여기서, wij는 j-번째 마이크로폰의 입력과 i-번째 빔포밍 출력을 연결하는 복소수 가중치 벡터이고, xj(n)은 j-번째 마이크로폰으로부터의 시간 에서의 입력 신호 벡터이며, × xj(n)는 컨볼루션 연산을 의미한다
|
3 |
3
제 2 항에 있어서,
상기 wij는,
수학식 2
와
수학식 3
(여기서, wi는 빔포머의 i-번째 출력을 계산하기 위한 가중치 벡터이고, w는 빔포머의 전체 출력을 계산하기 위한 가중치 행렬이다
|
4 |
4
제 3 항에 있어서,
상기 가중치 행렬(w)은,
수학식 4
for
(여기서, wi는 i-번째 빔포머 출력을 계산하기 위한 가중치 벡터이고, aH는 벡터 a의 Hermitian을 의미하고, s(φ)는 각도에 따라 결정되는 조향 벡터(steering vector)를 의미하며, g는 임의로 설정하는 이득을 의미하며, i-번째 출력이 원하는 방향의 신호를 그대로 전달하기 위해서는 g=1로, 원하는 방향의 신호를 상쇄시키기 위해서는 g=0으로 설정한다
|
5 |
5
제 4 항에 있어서,
상기 조향 벡터(s(φ))는,
수학식 5
(여기서, M은 마이크로폰의 개수이고, j는 허수이며, T는 트랜스 포즈를 의미한다
|
6 |
6
제 5 항에 있어서,
상기 φ는,
수학식 6
(여기서, φ는 음원의 방향(θ)에 따라 결정되는 값이고, d는 마이크로폰 사이의 간격이고, λ는 마이크로폰으로부터 입력되는 신호의 파장이다
|
7 |
7
제 1 항에 있어서,
상기 분리하는 단계는,
상기 녹음된 음성 신호와 잡음 신호가 입력될 경우, 2개의 출력을 갖게 되며 상기 출력을 위한 가중치 값은,
수학식 8
(여기서, w는 빔포머의 전체 출력을 계산하기 위한 가중치 행렬이고, H는 Hermitian을 의미하며, φt는 원하는 음성 신호의 방향을 나타내며, s(φ)는 각도에 따라 결정되는 조향 벡터로 M=2인 경우이다
|
8 |
8
제 7 항에 있어서,
상기 w1은 빔포머의 출력 중 음성을 포함하고 있는 출력을 계산하기 위한 가중치 벡터이고, w2는 빔포머의 출력 중 음성을 상쇄시킨 출력을 계산하기 위한 가중치 벡터로서,
수학식 9
(여기서, w는 빔포머의 전체 출력을 계산하기위한 가중치 행렬이고, T는 트랜스 포즈를 의미한다
|
9 |
9
제 8 항에 있어서,
상기 수학식 9에 의해 결정된 가중치 벡터는,
수학식 10
(여기서, x1, x2는 각각 첫 번째 및 두 번째 마이크로폰으로부터 입력된 신호를 의미한다
|
10 |
10
제 1 항에 있어서,
상기 분리하는 단계는,
상기 녹음된 음성 신호와 잡음 신호가 입력될 경우, 딜레이-앤드-섬(delay-and-sum) 빔포머를 이용하는 가중치는,
수학식 11
(여기서, di는 마이크로폰의 중점으로부터 각 마이크로폰까지의 거리이고, θ0은 원하는 음원의 방향이며, f는 신호의 주파수이며, c는 소리의 속도를 나타낸다
|
11 |
11
제 1 항에 있어서,
상기 암묵 처리 분리 과정은,
음성 방향을 제외한 나머지 영역에 대하여 균등하게 분포하는 음성 방향을 포함한 모든 방향에 대하여 마이크로폰의 전면 0∼180°를 L개의 방향으로 분할하여
0도, ,,, 개의 방향으로 설정하는 것을 특징으로 하는 음성과 잡음 신호 분리 방법
|
12 |
12
제 11 항에 있어서,
상기 L개의 방향 중 음성의 방향과 가장 가까운 각도를 음성의 방향과 동일하게 수정한 다음에, 상기 수정된 각각의 각도를 φ1, φ2,
|
13 |
13
한 개 이상의 음원이 존재하는 환경에서 사용자에 의해 발성된 음성 신호 및 잡음 신호를 녹음하는 다수의 마이크로폰과,
상기 녹음된 음성 신호 및 잡음 신호에 대하여 빔포밍 과정을 통해 공간적으로 신호 분리하는 빔포머와,
상기 빔포밍 과정을 거친 신호에 대한 암묵 처리 분리 과정을 통해 통계적으로 신호 분리하여 출력하는 음원 분리부를 포함하며,
상기 빔포머는, 2개의 출력 중에서 하나의 출력에는 설정된 각도에 1의 이득을 주도록 가중치를 결정하고, 나머지 1개의 출력에는 상기 설정된 각도에 0의 이득을 주도록 상기 가중치를 결정하는
음성과 잡음 신호 분리 장치
|
14 |
14
제 13 항에 있어서,
상기 빔포머는,
상기 다수의 마이크로폰으로부터 입력되는 상기 녹음된 음성 신호 및 잡음 신호를 공간적으로 분리하는 과정에서 사용자가 위치하는 방향에 해당하는 1개의 신호에 대하여 신호를 강화하는 것을 특징으로 하는 음성과 잡음 신호 분리 장치
|