맞춤기술찾기

이전대상기술

DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치 및 방법

  • 기술번호 : KST2019025599
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따르는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치는, 다수의 마이크로부터 입력되는 마이크 입력신호들을 각각 입력받아 STFT(Short-Time Fourier Transform) 처리하는 다수의 STFT; 상기 다수의 STFT 처리부가 출력하는 STFT 처리된 마이크 입력신호들을 입력받아 DCICA 처리를 이행하며, 타겟추정신호와 잡음추정신호를 생성하는 DCICA(Direction of arrival(DOA) Constrained Independent Component Analysis(ICA))부; 상기 STFT 처리된 마이크 입력신호들 중 어느 하나인 제1마이크 입력신호와, 상기 DCICA부가 출력하는 타겟추정신호와 잡음추정신호를 입력받아 LMPSC(logarithmic mel-frequency power spectral coefficient) 처리하여 스펙트럴 형태로 변환하여 출력하는 다수의 LMPSC 처리부; 상기 LMPSC 처리부가 출력하는 스펙트럴 형태로 변환되어 출력되는 제1마이크 입력신호와 타겟추정신호와 잡음추정신호를 입력받아 특징강화된 최종 타겟추정신호를 생성하는 DNN 기반 FE(DNN-Based Feature Enhancement) 처리부; 및 상기 최종 타겟추정신호를 제공받아 음성인식을 수행하는 ASR(Automatic Speech Recognition) 처리부;로 구성됨을 특징으로 한다. 또한 상기 방법은, 상기 DCICA부가 출력하는 잡음추정신호의 스케일을 가변하는 스케일링부; 상기 스케일링부가 출력하는 스케일링된 잡음추정신호를 입력받아 LMPSC 처리하여 스펙트럴 형태로 변환하여 출력하는 LMPSC; 및 상기 LMPSC가 출력하는 스펙트럴 형태로 변환된 스케일링된 잡음추정신호와 상기 DCICA가 출력하는 타겟추정신호를 입력받아 HMM(hidden markov model) 기반 FE 처리하여 특징 강화된 타켓추정신호를 생성하여 상기 DNN 기반 FE 처리부로 제공하는 HMM 기반 FE 처리부;를 더 구비하며, 상기 DNN 기반 FE 처리부는 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호를 입력받아 특징강화된 최종 타겟신호를 생성하며, 상기 DNN 기반 FE 처리부로 입력되는 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호는 스펙트럴 형태임을 특징으로 한다.
Int. CL G10L 15/07 (2013.01.01) G10L 15/14 (2006.01.01) G10L 15/20 (2006.01.01)
CPC G10L 15/07(2013.01) G10L 15/07(2013.01) G10L 15/07(2013.01) G10L 15/07(2013.01)
출원번호/일자 1020160023335 (2016.02.26)
출원인 서강대학교산학협력단
등록번호/일자 10-1720514-0000 (2017.03.22)
공개번호/일자
공고번호/일자 (20170411) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.02.26)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박형민 대한민국 서울특별시 서초구
2 이호용 대한민국 경기도 안양시 동안구
3 조지원 대한민국 서울특별시 마포구
4 김민욱 대한민국 경기도 고양시 일산동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이지연 대한민국 서울특별시 관악구 남부순환로 ****, ***호 제니스국제특허법률사무소 (봉천동, 청동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 서울특별시 마포구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.02.26 수리 (Accepted) 1-1-2016-0191546-96
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.11 수리 (Accepted) 4-1-2017-5005781-67
3 등록결정서
Decision to grant
2017.03.15 발송처리완료 (Completion of Transmission) 9-5-2017-0190579-05
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.01.22 수리 (Accepted) 4-1-2019-5014626-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치에 있어서, 다수의 마이크로부터 입력되는 마이크 입력신호들을 각각 입력받아 STFT(Short-Time Fourier Transform) 처리하는 다수의 STFT;상기 다수의 STFT 처리부가 출력하는 STFT 처리된 마이크 입력신호들을 입력받아 DCICA 처리를 이행하며, 타겟추정신호와 잡음추정신호를 생성하는 DCICA(Direction of arrival(DOA) Constrained Independent Component Analysis(ICA))부;상기 STFT 처리된 마이크 입력신호들 중 어느 하나인 제1마이크 입력신호와, 상기 DCICA부가 출력하는 타겟추정신호와 잡음추정신호를 입력받아 LMPSC(logarithmic mel-frequency power spectral coefficient) 처리하여 스펙트럴 형태로 변환하여 출력하는 다수의 LMPSC 처리부; 상기 LMPSC 처리부가 출력하는 스펙트럴 형태로 변환되어 출력되는 제1마이크 입력신호와 타겟추정신호와 잡음추정신호를 입력받아 특징강화된 최종 타겟추정신호를 생성하는 DNN 기반 FE(DNN-Based Feature Enhancement) 처리부; 및 상기 최종 타겟추정신호를 제공받아 음성인식을 수행하는 ASR(Automatic Speech Recognition) 처리부;로 구성됨을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치
2 2
제1항에 있어서, 상기 DCICA부가 출력하는 잡음추정신호의 스케일을 가변하는 스케일링부;상기 스케일링부가 출력하는 스케일링된 잡음추정신호를 입력받아 LMPSC 처리하여 스펙트럴 형태로 변환하여 출력하는 LMPSC;상기 LMPSC가 출력하는 스펙트럴 형태로 변환된 스케일링된 잡음추정신호와 상기 DCICA가 출력하는 타겟추정신호를 입력받아 HMM(hidden markov model) 기반 FE 처리하여 특징 강화된 타켓추정신호를 생성하여 상기 DNN 기반 FE 처리부로 제공하는 HMM 기반 FE 처리부;를 더 구비하며, 상기 DNN 기반 FE 처리부는 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호를 입력받아 특징강화된 최종 타겟신호를 생성하며, 상기 DNN 기반 FE 처리부로 입력되는 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호는 스펙트럴 형태임을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치
3 3
제1항에 있어서, 상기 특징 강화된 최종 타겟추정신호를 DCT 처리하여 상기 ASR 처리부로 제공하는 DCT 처리부를 더 구비함을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치
4 4
제1항에 있어서, 상기 DNN 기반 FE 처리부는 다수의 인접 프레임으로부터의 상기 마이크 입력신호와 상기 타켓추정신호와 상기 잡음추정신호를 입력받아 특징강화된 최종 타겟추정신호를 생성함을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식장치
5 5
DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식방법에 있어서, 다수의 마이크로부터 입력되는 마이크 입력신호들을 각각 입력받아 STFT 처리하여 STFT 처리된 마이크 입력신호들을 생성하는 단계;상기 STFT 처리된 마이크 입력신호들을 DCICA 처리를 이행하며, 타겟추정신호와 잡음추정신호를 생성하는 단계;상기 STFT 처리된 마이크 입력신호들 중 어느 하나인 제1마이크 입력신호와, DCICA부가 출력하는 타겟추정신호와 잡음추정신호에 대해 LMPSC 처리하여 스펙트럴 형태로 변환하는 단계; 상기 스펙트럴 형태로 변환되어 출력되는 제1마이크 입력신호와 타겟추정신호와 잡음추정신호에 대해 DNN 기반 FE 처리하여 특징강화된 최종 타겟추정신호를 생성하는 단계; 및 상기 최종 타겟추정신호로부터 음성인식을 수행하는 단계;를 구비함을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식방법
6 6
제5항에 있어서, 상기 잡음추정신호의 스케일을 가변하는 단계; 상기 스케일링된 잡음추정신호에 대해 LMPSC 처리하여 스펙트럴 형태로 변환하는 단계;상기 스펙트럴 형태로 변환된 스케일링된 잡음추정신호와 상기 타겟추정신호에 따라 HMM 기반 FE 처리하여 특징 강화된 타켓추정신호를 생성하는 단계;를 더 구비하며,상기 DNN 기반 FE 처리시에, 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호를 입력받아 특징강화된 최종 타겟신호를 생성하며, 상기 DNN 기반 FE 처리시에, 상기 제1마이크 입력신호와 상기 특징 강화된 타켓추정신호와 상기 잡음추정신호는 스펙트럴 형태임을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식방법
7 7
제5항에 있어서, 상기 특징 강화된 최종 타겟추정신호에 대한 음성인식 전에 DCT 처리하는 단계;를 더 구비함을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식방법
8 8
제5항에 있어서, 상기 DNN 기반 FE 처리시에는 다수의 인접 프레임으로부터의 상기 마이크 입력신호와 상기 타켓추정신호와 상기 잡음추정신호를 입력받아 특징강화된 최종 타겟추정신호를 생성함을 특징으로 하는 DCICA를 이용한 DNN 기반 특징향상을 수행하는 음성인식방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 서강대학교 산학협력단 기초연구사업/중견연구자지원사업 시청각정보를 이용한 강인한 멀티모달 음성인식 기술 개발