1 |
1
에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 마이크 입력 신호를 입력 받고, 상기 마이크 입력 신호를 제1입력 정보로 변환하여 출력하는 마이크 인코더;원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더; 상기 제1입력 정보와 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 기 학습된 제2인공신경망;상기 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 기 학습된 제3인공신경망;상기 추정 에코 신호, 상기 추정 잡음 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부;를 포함하고상기 제2인공신경망은 직렬적으로 연결된 복수 개의 인공신경망을 포함하고, 상기 제3인공신경망은 상기 제2인공신경망과 대등적으로 복수 개의 인공신경망이 직렬로 연결되어 있고,상기 제2인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 에코 신호를 다시 추정하고,상기 제3인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 잡음 신호를 다시 추정하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
2 |
2
제1항에 있어서,상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용한 가중치 정보를 출력하는 어텐션부;를 더 포함하고, 상기 제3입력 정보는 상기 가중치 정보를 더 포함하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
3 |
3
삭제
|
4 |
4
제1항에 있어서,상기 제2인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 에코 신호를 다시 추정하고, 상기 제3인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 잡음 신호를 다시 추정하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
5 |
5
제1항에 있어서,상기 제2인공신경망은 제2-A 인공신경망 및 제2-B 인공신경망을 포함하고, 상기 제3인공신경망은 제3-A 인공신경망 및 제3-B 인공신경망을 포함하며,상기 제2-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제2출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고, 상기 제3-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제3출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
6 |
6
제5항에 있어서,상기 제2-B 인공신경망은 상기 제2입력 정보에서 상기 제2출력 정보를 혼합 한 후, 상기 제3출력 정보를 뺀 제4입력 정보를 입력 정보로 하고, 상기 제4입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제4출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고,상기 제3-B 인공신경망은 상기 제3입력 정보에서 상기 제3출력 정보를 혼합 한 후, 상기 제2출력 정보를 뺀 제5입력 정보를 입력 정보로 하고, 상기 제5입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제5출력 정보를 출력 정보로 하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
7 |
7
제1항에 있어서,상기 마이크 인코더는, 시간 영역(time-domain)에서의 상기 마이크 입력 신호를 잠재 영역(latent-domain)에서의 신호로 변환하고,잠재 영역에서의 상기 추정 음성 신호를 시간 영역에서의 추정 음성 신호로 변환하는 디코더(decoder);를 더 포함하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 장치
|
8 |
8
마이크 인코더를 통해, 에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 마이크 입력 신호를 입력 받고, 상기 마이크 입력 신호를 제1입력 정보로 변환하여 출력하는 단계;원단 신호 인코더를 통해, 원단 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 단계; 상기 제1입력 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 직렬적으로 연결되어 있는 복수 개의 인공신경망을 포함하는, 기 학습된 제2인공신경망을 통해 상기 추정 에코 신호를 출력 하는 단계;상기 제3입력 정보를 입력 정보로 하고, 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 상기 제2인공신경망과 대등적으로 복수 개의 인공신경망이 직렬적으로 연결되어 있는, 기 학습된 제3인공신경망을 통해 상기 추정 잡음 신호를 출력 하는 단계;상기 추정 에코 신호, 상기 추정 에코 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 단계;를 포함하고상기 추정 에코 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 에코 신호를 다시 추정하는 단계를 포함하고,상기 추정 잡음 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 잡음 신호를 다시 추정하는, 병렬 구조의 심화신경망을 이용한 잡음 및 에코 신호 통합 제거 방법
|