맞춤기술찾기

이전대상기술

심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치

  • 기술번호 : KST2018014298
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 심화신경망 기반의 잡음 및 에코의 통합 제거 방법 및 장치가 제시된다. 일 실시예에 따른 심화신경망 기반의 잡음 및 에코의 통합 제거 방법은, 잡음 및 에코가 포함된 음성 신호로부터 특징 벡터를 추출하는 단계; 및 상기 특징 벡터와 심화신경망(DNN)의 학습을 통해 추정된 잡음 및 에코의 통합 제거 이득을 이용하여 잡음 및 에코가 통합 제거된 최종 음성 신호를 획득하는 단계를 포함하여 이루어질 수 있다.
Int. CL G10L 21/02 (2006.01.01) G10L 25/30 (2013.01.01)
CPC G10L 21/02(2013.01) G10L 21/02(2013.01) G10L 21/02(2013.01) G10L 21/02(2013.01) G10L 21/02(2013.01)
출원번호/일자 1020170048574 (2017.04.14)
출원인 한양대학교 산학협력단
등록번호/일자
공개번호/일자 10-2018-0115984 (2018.10.24) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.04.14)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장준혁 대한민국 서울특별시 강남구
2 서혜지 대한민국 경기도 성남시 분당구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.04.14 수리 (Accepted) 1-1-2017-0367685-96
2 의견제출통지서
Notification of reason for refusal
2018.06.25 발송처리완료 (Completion of Transmission) 9-5-2018-0428797-46
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.08.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0840362-17
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.08.24 수리 (Accepted) 1-1-2018-0840361-61
5 등록결정서
Decision to grant
2018.12.20 발송처리완료 (Completion of Transmission) 9-5-2018-0878758-53
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.05 수리 (Accepted) 4-1-2019-5155816-75
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.06 수리 (Accepted) 4-1-2019-5156285-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
심화신경망(DNN)을 학습시키는 단계; 잡음 및 에코가 포함된 음성 신호로부터 특징 벡터를 추출하는 단계; 및 상기 특징 벡터와 심화신경망(DNN)의 학습을 통해 추정된 잡음 및 에코의 통합 제거 이득을 이용하여 잡음 및 에코가 통합 제거된 최종 음성 신호를 획득하는 단계를 포함하고, 상기 심화신경망(DNN)을 학습시키는 단계는, 학습 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호로부터 특징 벡터를 추출하는 단계; 및 상기 특징 벡터를 심화신경망(DNN)의 입력 특징 벡터로 이용하고, 학습된 심화신경망(DNN)의 모델인 가중치(weight) 파라미터와 바이어스(bias) 파라미터에 상기 입력 특징 벡터를 통과시켜 잡음 및 에코의 통합 제거 이득을 추정하는 단계를 포함하며, 상기 심화신경망(DNN)의 입력 특징 벡터는, 상기 마이크 입력 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS), 상기 원단 화자 신호의 로그 파워 스펙트럼 및 추가적 잡음 및 에코 정보를 이어 붙여 사용하고, 상기 특징 벡터와 심화신경망(DNN)의 학습을 통해 추정된 잡음 및 에코의 통합 제거 이득을 이용하여 잡음 및 에코가 통합 제거된 최종 음성 신호를 획득하는 단계는, 상기 잡음 및 에코가 포함된 마이크 입력 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)에 추정된 상기 잡음 및 에코의 통합 제거 이득을 곱하여 근단 화자 신호의 로그 파워 스펙트럼을 획득하는 단계; 및 상기 근단 화자 신호의 로그 파워 스펙트럼을 잡음 및 에코가 존재하는 신호의 위상과 함께 인버스 숏타임 푸리에 변환(Inverse Short-Time Fourier Transform, ISTFT)하여 최종적으로 잡음 및 에코가 제거된 최종 근단 화자 신호의 파형을 획득하는 단계를 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
2 2
삭제
3 3
제1항에 있어서, 상기 심화신경망(DNN)을 학습시키는 단계는, 학습 단계에서, 음성 신호의 통계적 정보인 사전 신호대에코비 및 사후 신호대에코비(a priori and a posteriori SER) 및 사전 신호대잡음비 및 사후 신호대잡음비(a priori and a posteriori SNR)를 추출된 상기 특징 벡터에 연결하여 상기 심화신경망(DNN)의 입력 특징 벡터로 이용하는 단계를 더 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
4 4
제1항에 있어서, 상기 학습 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호로부터 특징 벡터를 추출하는 단계는, 상기 학습 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호를 대상으로 숏타임 푸리에 변환(Short-Time Fourier Transform, STFT)을 수행하여 시간 영역에서 주파수 영역의 신호로 변환하고, 변환된 주파수 영역의 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 상기 특징 벡터로 추출하는 것을 특징으로 하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
5 5
제1항에 있어서, 상기 심화신경망(DNN)을 학습시키는 단계는, 상기 심화신경망(DNN)의 회기 학습(regression)을 통하여 연속적인 최적 이득(optimal gain)을 추정하고, 평균제곱오차(Mean Squared Error, MSE)를 상기 심화신경망(DNN)의 목적 함수로 하여 타겟(target) 특징 벡터인 잡음 및 에코의 통합 제거 이득과 상기 심화신경망(DNN)을 통하여 추정된 상기 잡음 및 에코의 통합 제거 이득의 차이를 최소화하는 방향으로 심화신경망(DNN)의 학습이 진행되는 것을 특징으로 하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
6 6
제1항에 있어서, 상기 잡음 및 에코가 포함된 음성 신호로부터 특징 벡터를 추출하는 단계는, 음성 향상 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호로부터 특징 벡터를 추출하는 단계; 및 음성 향상 단계에서, 음성 신호의 통계적 정보인 사전 신호대에코비 및 사후 신호대에코비(a priori and a posteriori SER) 및 사전 신호대잡음비 및 사후 신호대잡음비(a priori and a posteriori SNR)를 추출된 상기 특징 벡터에 연결하여 상기 심화신경망(DNN)의 입력 특징 벡터로 이용하는 단계를 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
7 7
제6항에 있어서, 상기 음성 향상 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호로부터 특징 벡터를 추출하는 단계는, 상기 음성 향상 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호를 대상으로 숏타임 푸리에 변환(Short-Time Fourier Transform, STFT)을 수행하여 시간 영역에서 주파수 영역의 신호로 변환하고, 변환된 주파수 영역의 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 상기 특징 벡터로 추출하는 것을 특징으로 하는 심화신경망 기반의 잡음 및 에코의 통합 제거 방법
8 8
삭제
9 9
심화신경망(DNN)을 학습시키는 심화신경망 학습부; 잡음 및 에코가 포함된 음성 신호로부터 특징 벡터를 추출하는 특징 벡터 추출부; 및 상기 특징 벡터와 심화신경망(DNN)의 학습을 통해 추정된 잡음 및 에코의 통합 제거 이득을 이용하여 잡음 및 에코가 통합 제거된 최종 음성 신호를 획득하는 음성 신호 재구성부를 포함하고, 상기 심화신경망 학습부는, 학습 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호로부터 특징 벡터를 추출하는 학습부의 특징 벡터 추출부; 및 상기 특징 벡터를 심화신경망(DNN)의 입력 특징 벡터로 이용하고, 학습된 심화신경망(DNN)의 모델인 가중치(weight) 파라미터와 바이어스(bias) 파라미터에 입력 특징 벡터를 통과시켜 잡음 및 에코의 통합 제거 이득을 추정하는 심화신경망(DNN) 모델링부를 포함하며, 상기 심화신경망(DNN)의 입력 특징 벡터는, 상기 마이크 입력 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS), 상기 원단 화자 신호의 로그 파워 스펙트럼 및 추가적 잡음 및 에코 정보를 이어 붙여 사용하고, 상기 음성 신호 재구성부는, 상기 잡음 및 에코가 포함된 마이크 입력 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)에 추정된 상기 잡음 및 에코의 통합 제거 이득을 곱하여 근단 화자 신호의 로그 파워 스펙트럼을 획득하고, 상기 근단 화자 신호의 로그 파워 스펙트럼을 잡음 및 에코가 존재하는 신호의 위상과 함께 인버스 숏타임 푸리에 변환(Inverse Short-Time Fourier Transform, ISTFT)하여 최종적으로 잡음 및 에코가 제거된 최종 근단 화자 신호의 파형을 획득하는 것을 특징으로 하는 심화신경망 기반의 잡음 및 에코의 통합 제거 장치
10 10
삭제
11 11
제9항에 있어서, 상기 학습부의 특징 벡터 추출부는, 학습 단계에서, 음성 신호의 통계적 정보인 사전 신호대에코비 및 사후 신호대에코비(a priori and a posteriori SER) 및 사전 신호대잡음비 및 사후 신호대잡음비(a priori and a posteriori SNR)를 추출된 상기 특징 벡터에 연결하여 상기 심화신경망(DNN)의 입력 특징 벡터로 이용하는 학습부의 잡음 및 에코 정보부를 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 장치
12 12
제9항에 있어서, 상기 학습부의 특징 벡터 추출부는, 상기 학습 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호를 대상으로 숏타임 푸리에 변환(Short-Time Fourier Transform, STFT)을 수행하여 시간 영역에서 주파수 영역의 신호로 변환하고, 변환된 주파수 영역의 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 상기 특징 벡터로 추출하는 학습부의 스펙트럼 추출부를 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 장치
13 13
제9항에 있어서, 상기 심화신경망(DNN) 모델링부는, 상기 심화신경망(DNN)의 회기 학습(regression)을 통하여 연속적인 최적 이득(optimal gain)을 추정하고, 평균제곱오차(Mean Squared Error, MSE)를 상기 심화신경망(DNN)의 목적 함수로 하여 타겟(target) 특징 벡터인 잡음 및 에코의 통합 제거 이득과 상기 심화신경망(DNN)을 통하여 추정된 상기 잡음 및 에코의 통합 제거 이득의 차이를 최소화하는 방향으로 심화신경망(DNN)의 학습이 진행되는 것을 특징으로 하는 심화신경망 기반의 잡음 및 에코의 통합 제거 장치
14 14
제9항에 있어서, 상기 특징 벡터 추출부는, 음성 향상 단계에서, 잡음 및 에코가 포함된 마이크 입력 신호와 원단 화자 신호를 대상으로 숏타임 푸리에 변환(Short-Time Fourier Transform, STFT)을 수행하여 시간 영역에서 주파수 영역의 신호로 변환하고, 변환된 주파수 영역의 신호의 로그 파워 스펙트럼(Log Power Spectrum, LPS)을 상기 특징 벡터로 추출하는 스펙트럼 추출부; 및 음성 향상 단계에서, 음성 신호의 통계적 정보인 사전 신호대에코비 및 사후 신호대에코비(a priori and a posteriori SER) 및 사전 신호대잡음비 및 사후 신호대잡음비(a priori and a posteriori SNR)를 추출된 상기 특징 벡터에 연결하여 상기 심화신경망(DNN)의 입력 특징 벡터로 이용하는 잡음 및 에코 정보부를 포함하는 심화신경망 기반의 잡음 및 에코의 통합 제거 장치
15 15
삭제
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20200105287 US 미국 FAMILY
2 WO2018190547 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2020105287 US 미국 DOCDBFAMILY
2 WO2018190547 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한양대학교 산학협력단 이공분야 기초연구사업 / 중견연구자지원사업 / 도약연구(전략-연구분야지정) 미래 웨어러블기기용 고성능 음성신호처리 핵심기술개발