맞춤기술찾기

이전대상기술

LSTM 및 심화신경망 기반의 음성 신호 처리 방법 및 장치

  • 기술번호 : KST2019030940
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 LSTM 및 심화신경망 기반의 음성 신호 처리 방법 및 장치가 개시된다. 음성 신호 처리 방법은 잡음이 포함된 음성 신호로부터 특징 벡터를 추출하는 단계, 상기 특징 벡터 및 상기 잡음이 포함된 음성 신호를 LSTM(Long Short Term Memory) 모델의 입력 파라미터로 이용하여 잡음이 감소 또는 제거된 음성 신호를 출력하는 단계, 및 출력된 상기 음성 신호와 상기 잡음이 포함된 음성 신호를 심화신경망(DNN) 모델의 입력 파라미터로 이용하여 음성 합성된 최종 음성 신호를 출력하는 단계를 포함할 수 있다.
Int. CL G10L 15/20 (2006.01.01) G10L 15/14 (2006.01.01) G10L 15/16 (2006.01.01) G10L 17/04 (2013.01.01)
CPC G10L 15/20(2013.01) G10L 15/20(2013.01) G10L 15/20(2013.01) G10L 15/20(2013.01)
출원번호/일자 1020160106135 (2016.08.22)
출원인 한양대학교 산학협력단
등록번호/일자 10-1807961-0000 (2017.12.05)
공개번호/일자
공고번호/일자 (20171211) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020160070284   |   2016.06.07
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.08.22)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서혜지 대한민국 경기도 성남시 분당구
2 장준혁 대한민국 서울특별시 강남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.08.22 수리 (Accepted) 1-1-2016-0813046-92
2 의견제출통지서
Notification of reason for refusal
2017.06.20 발송처리완료 (Completion of Transmission) 9-5-2017-0428181-08
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.08.21 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-0804184-18
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.08.21 수리 (Accepted) 1-1-2017-0804183-62
5 등록결정서
Decision to grant
2017.11.30 발송처리완료 (Completion of Transmission) 9-5-2017-0838616-17
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.05 수리 (Accepted) 4-1-2019-5155816-75
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.06 수리 (Accepted) 4-1-2019-5156285-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
잡음이 포함된 음성 신호로부터 특징 벡터를 추출하는 단계;상기 특징 벡터 및 상기 잡음이 포함된 음성 신호를 LSTM(Long Short Term Memory) 모델의 입력 파라미터로 이용하여 잡음이 감소 또는 제거된 음성 신호를 출력하는 단계; 및출력된 상기 음성 신호와 상기 잡음이 포함된 음성 신호를 심화신경망(DNN) 모델의 입력 파라미터로 이용하여 음성 합성된 최종 음성 신호를 출력하는 단계를 포함하고,상기 최종 음성 신호는 상기 LSTM 모델과 상기 심화신경망(DNN) 모델을 적층으로 쌓은 구조를 통해 학습되어 출력되는 신호를 나타내고,상기 특징 벡터를 추출하는 단계는,상기 잡음이 포함된 음성 신호를 대상으로 STFT(Short Time Frequency Transform)을 수행하여 시간영역에서 주파수 영역의 신호로 변환하는 단계;연속 데이터인 음성 신호의 특성이 반영되도록, 상기 변환된 주파수 영역의 신호의 크기에 로그 연산자(log)를 적용함으로써, 주파수 영역의 신호의 로그 파워 스펙트럼(log power spectrum)을 계산하는 단계; 및계산된 로그파워 스펙트럼을 상기 특징 벡터로 추출하는 단계를 포함하는 음성 신호 처리 방법
2 2
삭제
3 3
삭제
4 4
제1항에 있어서,상기 잡음이 감소 또는 제거된 음성 신호를 출력하는 단계는,상기 특징 벡터 및 상기 잡음이 포함된 음성 신호의 크기에 해당하는 로그 파워 스펙트럼을 학습이 완료된 상기 LSTM 모델의 입력 파라미터로 이용하여 상기 잡음이 감소 또는 제거된 음성 신호를 생성하는 것을 특징으로 하는 음성 신호 처리 방법
5 5
제1항에 있어서,상기 최종 음성 신호의 로그파워 스펙트럼과 상기 잡음이 포함된 음성 신호의 위상을 대상으로 ISTFT(Inverse Short Time Frequency Transform)를 수행하여 최종 음성 신호를 재구성하는 단계를 더 포함하는 음성 신호 처리 방법
6 6
제1항에 있어서,상기 LSTM 모델은 메모리 셀과 은닉 스테이트(hidden state)에 저장된 이전 프레임에 해당하는 음성 신호와 상기 LSTM 모델의 입력 파라미터에 기초하여 현재 프레임에 해당하는 음성 신호를 생성하는 것을 특징으로 하는 음성 신호 처리 방법
7 7
제1항에 있어서,상기 LSTM 모델은 특징 벡터인 잡음이 포함된 음성 신호의 로그 파워 스펙트럼과 타겟 벡터인 잡음이 포함되지 않은 음성 신호의 로그 파워 스펙트럼의 차이가 기정의된 차이값 이하로 감소하도록 학습이 진행되어 생성되는 것을 특징으로 하는 음성 신호 처리 방법
8 8
제1항에 있어서,상기 심화신경망(DNN) 모델은 MSE(Mean Square Error)를 심화신경망(DNN) 모델의 목적 함수로 설정하고, 심화신경망(DNN) 모델의 입력 파라미터와 출력 파라미터 사이의 관계를 모델링하는 BP(Backpropagation)에 기초하여 학습이 완료됨에 따라 생성되는 것을 특징으로 하는 음성 신호 처리 방법
9 9
잡음이 포함된 음성 신호로부터 특징 벡터를 추출하는 특징 벡터 추출부;상기 특징 벡터 및 상기 잡음이 포함된 음성 신호를 LSTM(Long Short Term Memory) 모델의 입력 파라미터로 이용하여 잡음이 감소 또는 제거된 음성 신호를 출력하는 LSTM 처리부; 및출력된 상기 음성 신호와 상기 잡음이 포함된 음성 신호를 심화신경망(DNN) 모델의 입력 파라미터로 이용하여 음성 합성된 최종 음성 신호를 출력하는 DNN 처리부를 포함하고,상기 최종 음성 신호는 상기 LSTM 모델과 상기 심화신경망(DNN) 모델을 적층으로 쌓은 구조를 통해 학습되어 출력되는 신호를 나타내고,상기 특징 벡터 추출부는,상기 잡음이 포함된 음성 신호를 대상으로 STFT(Short Time Frequency Transform)을 수행하여 시간영역에서 주파수 영역의 신호로 변환하고,연속 데이터인 음성 신호의 특성이 반영되도록, 상기 변환된 주파수 영역의 신호의 크기에 로그 연산자(log)를 적용함으로써, 주파수 영역의 신호의 로그 파워 스펙트럼(log power spectrum)을 계산하고,계산된 로그파워 스펙트럼을 상기 특징 벡터로 추출하는 것을 특징으로 하는 음성 신호 처리 장치
10 10
삭제
11 11
삭제
12 12
제9항에 있어서,상기 LSTM 처리부는,상기 특징 벡터 및 상기 잡음이 포함된 음성 신호의 크기에 해당하는 로그 파워 스펙트럼을 학습이 완료된 상기 LSTM 모델의 입력 파라미터로 이용하여 상기 잡음이 감소 또는 제거된 음성 신호를 생성하는 것을 특징으로 하는 음성 신호 처리 장치
13 13
제9항에 있어서,상기 최종 음성 신호의 로그파워 스펙트럼과 상기 잡음이 포함된 음성 신호의 위상을 대상으로 ISTFT(Inverse Short Time Frequency Transform)를 수행하여 최종 음성 신호를 재구성하는 음성 신호 재구성부를 더 포함하는 음성 신호 처리 장치
14 14
제9항에 있어서,상기 LSTM 모델은 메모리 셀과 은닉 스테이트(hidden state)에 저장된 이전 프레임에 해당하는 음성 신호와 상기 LSTM 모델의 입력 파라미터에 기초하여 현재 프레임에 해당하는 음성 신호를 생성하는 것을 특징으로 하는 음성 신호 처리 장치
15 15
제9항에 있어서,상기 LSTM 모델은 특징 벡터인 잡음이 포함된 음성 신호의 로그 파워 스펙트럼과 타겟 벡터인 잡음이 포함되지 않은 음성 신호의 로그 파워 스펙트럼의 차이가 기정의된 차이값 이하로 감소하도록 학습이 진행되어 생성되는 것을 특징으로 하는 음성 신호 처리 장치
16 16
제9항에 있어서,상기 심화신경망(DNN) 모델은 MSE(Mean Square Error)를 심화신경망(DNN) 모델의 목적 함수로 설정하고, 심화신경망(DNN) 모델의 입력 파라미터와 출력 파라미터 사이의 관계를 모델링하는 BP(Backpropagation)에 기초하여 학습이 완료됨에 따라 생성되는 것을 특징으로 하는 음성 신호 처리 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한양대학교 산학협력단 원천기술개발사업 / 나노소재 기술개발사업 / 나노소재 원천기술개발사업 생체모방형 촉각센서 기반의 질감 인지를 위한 신호처리 기술 개발