1 |
1
에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 복수 개의 마이크 인코더;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 채널 변환부;원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더; 상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용하여 가중치 정보를 출력하는 어텐션부;상기 가중치 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 음성 신호를 추정하기 위한 마스크 정보를 포함하는 제1출력 정보를 출력 정보로 하는, 기 학습된 제1인공신경망; 및상기 제1출력 정보와 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부;를 포함하며,상기 어텐션부는,상기 제1입력 정보와 상기 제2입력 정보와의 상관 관계를 분석하여, 분석된 결과를 기초로 상기 가중치 정보를 출력하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
2 |
2
제1항에 있어서, 상기 마이크 인코더는, 시간 영역(time-domain)에서의 상기 마이크 입력 신호를 잠재 영역(latent-domain)에서의 신호로 변환하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
3 |
3
제2항에 있어서, 잠재 영역에서의 상기 추정 음성 신호를 시간 영역에서의 추정 음성 신호로 변환하는 디코더(decoder);를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
4 |
4
삭제
|
5 |
5
제1항에 있어서,상기 어텐션부는,상기 제1입력 정보에 포함되어 있는 상기 원단 신호에 대한 정보를 기초로 상기 에코 신호를 추정한 후, 추정된 에코 신호를 기초로 상기 가중치 정보를 출력하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
6 |
6
에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 복수 개의 마이크 인코더;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 채널 변환부;원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더; 상기 제1입력 정보와 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 기 학습된 제2인공신경망;상기 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 기 학습된 제3인공신경망;상기 추정 에코 신호, 상기 추정 잡음 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부;를 포함하고상기 제2인공신경망은 직렬적으로 연결된 복수 개의 인공신경망을 포함하며,상기 제3인공신경망은 상기 제2인공신경망과 대등적으로 복수 개의 인공신경망이 직렬로 연결되어 있고,상기 제2인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 에코 신호를 다시 추정하고,상기 제3인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
7 |
7
제6항에 있어서,상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용한 가중치 정보를 출력하는 어텐션부;를 더 포함하고,상기 제3입력 정보는, 상기 가중치 정보를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
8 |
8
삭제
|
9 |
9
제6항에 있어서,상기 제2인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 에코 신호를 다시 추정하고, 상기 제3인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
10 |
10
제6항에 있어서,상기 제2인공신경망은 제2-A 인공신경망 및 제2-B 인공신경망을 포함하고, 상기 제3인공신경망은 제3-A 인공신경망 및 제3-B 인공신경망을 포함하며,상기 제2-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제2출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고, 상기 제3-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제3출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
11 |
11
제10항에 있어서,상기 제2-B 인공신경망은 상기 제2입력 정보에서 상기 제2출력 정보를 혼합 한 후, 상기 제3출력 정보를 뺀 제4입력 정보를 입력 정보로 하고, 상기 제4입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제4출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고,상기 제3-B 인공신경망은 상기 제3입력 정보에서 상기 제3출력 정보를 혼합 한 후, 상기 제2출력 정보를 뺀 제5입력 정보를 입력 정보로 하고, 상기 제5입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제5출력 정보를 출력 정보로 하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
12 |
12
제6항에 있어서,상기 마이크 인코더는, 시간 영역(time-domain)에서의 상기 마이크 입력 신호를 잠재 영역(latent-domain)에서의 신호로 변환하고,잠재 영역에서의 상기 추정 음성 신호를 시간 영역에서의 추정 음성 신호로 변환하는 디코더(decoder);를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
|
13 |
13
복수 개의 마이크 인코더를 통해 에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 단계;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 단계;원단 신호 인코더를 이용하여 원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 단계;상기 제1입력 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 직렬적으로 연결되어 있는 복수 개의 인공신경망을 포함하는 기 학습된 제2인공신경망을 통해 상기 추정 에코 신호를 출력 하는 단계;상기 제3입력 정보를 입력 정보로 하고, 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 직렬적으로 연결되어 있는 복수 개의 인공신경망을 포함하는 기 학습된 제3인공신경망을 통해 상기 추정 잡음 신호를 출력 하는 단계;상기 추정 에코 신호, 상기 추정 잡음 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 단계;를 포함하고 상기 추정 에코 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 에코 신호를 다시 추정하는 단계를 포함하고,상기 추정 잡음 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 방법
|
14 |
14
제13항에 있어서,상기 제3입력 정보는,상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘을 적용하여 생성한 가중치 정보를 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 방법
|
15 |
15
삭제
|