맞춤기술찾기

이전대상기술

심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치

  • 기술번호 : KST2022006655
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 일 실시예에 따른 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치는, 에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 복수 개의 마이크 인코더, 상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 채널 변환부, 원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더, 상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용하여 가중치 정보를 출력하는 어텐션부, 상기 가중치 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 음성 신호를 추정하기 위한 마스크 정보를 포함하는 제1출력 정보를 출력 정보로 하는, 기 학습된 제1인공신경망 및 상기 제1출력 정보와 상기 제2입력 정보를 기초로 상기 음성 신호부를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부를 포함할 수 있다.
Int. CL G10L 21/02 (2006.01.01) G10L 19/008 (2014.01.01) H04R 3/00 (2006.01.01) H04R 3/02 (2006.01.01) G10L 25/30 (2013.01.01) G06N 3/08 (2006.01.01) G10L 21/0216 (2013.01.01)
CPC G10L 21/02(2013.01) G10L 19/008(2013.01) H04R 3/005(2013.01) H04R 3/02(2013.01) G10L 25/30(2013.01) G06N 3/08(2013.01) G10L 2021/02166(2013.01)
출원번호/일자 1020210009000 (2021.01.21)
출원인 한양대학교 산학협력단
등록번호/일자 10-2316712-0000 (2021.10.19)
공개번호/일자
공고번호/일자 (20211022) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.21)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장준혁 서울특별시 성동구
2 박송규 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 해움특허법인 대한민국 서울특별시 서초구 강남대로 ***, *층(반포동, 세영제이타워)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 서울특별시 성동구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.21 수리 (Accepted) 1-1-2021-0084994-12
2 [우선심사신청]심사청구서·우선심사신청서
2021.01.26 수리 (Accepted) 1-1-2021-0104520-54
3 보정요구서
Request for Amendment
2021.01.28 발송처리완료 (Completion of Transmission) 1-5-2021-0017779-35
4 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.01.29 수리 (Accepted) 1-1-2021-0118559-06
5 선행기술조사의뢰서
Request for Prior Art Search
2021.02.15 수리 (Accepted) 9-1-9999-9999999-89
6 선행기술조사보고서
Report of Prior Art Search
2021.03.04 발송처리완료 (Completion of Transmission) 9-6-2021-0062419-91
7 의견제출통지서
Notification of reason for refusal
2021.04.07 발송처리완료 (Completion of Transmission) 9-5-2021-0280951-48
8 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2021.06.07 수리 (Accepted) 1-1-2021-0657043-02
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.06.07 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-0657042-56
10 등록결정서
Decision to grant
2021.08.26 발송처리완료 (Completion of Transmission) 9-5-2021-0678983-77
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 복수 개의 마이크 인코더;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 채널 변환부;원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더; 상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용하여 가중치 정보를 출력하는 어텐션부;상기 가중치 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 음성 신호를 추정하기 위한 마스크 정보를 포함하는 제1출력 정보를 출력 정보로 하는, 기 학습된 제1인공신경망; 및상기 제1출력 정보와 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부;를 포함하며,상기 어텐션부는,상기 제1입력 정보와 상기 제2입력 정보와의 상관 관계를 분석하여, 분석된 결과를 기초로 상기 가중치 정보를 출력하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
2 2
제1항에 있어서, 상기 마이크 인코더는, 시간 영역(time-domain)에서의 상기 마이크 입력 신호를 잠재 영역(latent-domain)에서의 신호로 변환하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
3 3
제2항에 있어서, 잠재 영역에서의 상기 추정 음성 신호를 시간 영역에서의 추정 음성 신호로 변환하는 디코더(decoder);를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
4 4
삭제
5 5
제1항에 있어서,상기 어텐션부는,상기 제1입력 정보에 포함되어 있는 상기 원단 신호에 대한 정보를 기초로 상기 에코 신호를 추정한 후, 추정된 에코 신호를 기초로 상기 가중치 정보를 출력하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
6 6
에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 복수 개의 마이크 인코더;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 채널 변환부;원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 원단 신호 인코더; 상기 제1입력 정보와 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 기 학습된 제2인공신경망;상기 제3입력 정보를 입력 정보로 하고, 상기 제2입력 정보에서 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 기 학습된 제3인공신경망;상기 추정 에코 신호, 상기 추정 잡음 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 음성 신호 추정부;를 포함하고상기 제2인공신경망은 직렬적으로 연결된 복수 개의 인공신경망을 포함하며,상기 제3인공신경망은 상기 제2인공신경망과 대등적으로 복수 개의 인공신경망이 직렬로 연결되어 있고,상기 제2인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 에코 신호를 다시 추정하고,상기 제3인공신경망의 복수 개의 인공신경망은 전 단계의 인공신경망에서 출력한 정보를 기초로 다시 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
7 7
제6항에 있어서,상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘(attention mechanism)을 적용한 가중치 정보를 출력하는 어텐션부;를 더 포함하고,상기 제3입력 정보는, 상기 가중치 정보를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
8 8
삭제
9 9
제6항에 있어서,상기 제2인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 에코 신호를 다시 추정하고, 상기 제3인공신경망은, 제2입력 정보, 상기 추정 에코 신호 및 상기 잡음 신호를 입력 정보로 하여 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
10 10
제6항에 있어서,상기 제2인공신경망은 제2-A 인공신경망 및 제2-B 인공신경망을 포함하고, 상기 제3인공신경망은 제3-A 인공신경망 및 제3-B 인공신경망을 포함하며,상기 제2-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제2출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고, 상기 제3-A 인공신경망은, 제3입력 정보를 입력 정보로 하고, 상기 제3입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제3출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
11 11
제10항에 있어서,상기 제2-B 인공신경망은 상기 제2입력 정보에서 상기 제2출력 정보를 혼합 한 후, 상기 제3출력 정보를 뺀 제4입력 정보를 입력 정보로 하고, 상기 제4입력 정보에 기초하여 상기 에코 신호를 추정한 정보를 포함하고 있는 제4출력 정보를 출력 정보로 하는, 기 학습된 인공신경망을 포함하고,상기 제3-B 인공신경망은 상기 제3입력 정보에서 상기 제3출력 정보를 혼합 한 후, 상기 제2출력 정보를 뺀 제5입력 정보를 입력 정보로 하고, 상기 제5입력 정보에 기초하여 상기 잡음 신호를 추정한 정보를 포함하고 있는 제5출력 정보를 출력 정보로 하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
12 12
제6항에 있어서,상기 마이크 인코더는, 시간 영역(time-domain)에서의 상기 마이크 입력 신호를 잠재 영역(latent-domain)에서의 신호로 변환하고,잠재 영역에서의 상기 추정 음성 신호를 시간 영역에서의 추정 음성 신호로 변환하는 디코더(decoder);를 더 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 장치
13 13
복수 개의 마이크 인코더를 통해 에코 신호, 잡음 신호 및 발화자의 음성 신호를 포함하고 있는 복수 개의 마이크 입력 신호를 입력 받고, 상기 복수 개의 마이크 입력 신호를 각각 복수 개의 변환 정보로 변환하여 출력하는 단계;상기 복수 개의 변환 정보를 압축하여 단일 채널의 크기를 가지는 제1입력 정보로 변환하여 출력하는 단계;원단 신호 인코더를 이용하여 원단(far-end) 신호를 입력 받고, 상기 원단 신호를 제2입력 정보로 변환하여 출력하는 단계;상기 제1입력 정보 및 상기 제2입력 정보의 합산 정보인 제3입력 정보를 입력 정보로 하고, 상기 에코 신호를 추정한 추정 에코 신호를 출력 정보로 하는, 직렬적으로 연결되어 있는 복수 개의 인공신경망을 포함하는 기 학습된 제2인공신경망을 통해 상기 추정 에코 신호를 출력 하는 단계;상기 제3입력 정보를 입력 정보로 하고, 상기 잡음 신호를 추정한 추정 잡음 신호를 출력 정보로 하는, 직렬적으로 연결되어 있는 복수 개의 인공신경망을 포함하는 기 학습된 제3인공신경망을 통해 상기 추정 잡음 신호를 출력 하는 단계;상기 추정 에코 신호, 상기 추정 잡음 신호 및 상기 제2입력 정보를 기초로 상기 음성 신호를 추정한 추정 음성 신호를 출력하는 단계;를 포함하고 상기 추정 에코 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 에코 신호를 다시 추정하는 단계를 포함하고,상기 추정 잡음 신호를 출력 하는 단계는,전 단계의 인공신경망에서 출력한 정보를 기초로 다음 단계의 인공신경망이 다시 상기 잡음 신호를 다시 추정하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 방법
14 14
제13항에 있어서,상기 제3입력 정보는,상기 제1입력 정보와 상기 제2입력 정보에 대해 어텐션 메커니즘을 적용하여 생성한 가중치 정보를 포함하는, 심화 신경망을 이용한 다채널 기반의 잡음 및 에코 신호 통합 제거 방법
15 15
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한양대학교산학협력단 방송통신산업기술개발(R&D) AI스피커 음성비서를 위한 지능형 음성신호처리 기술개발