맞춤기술찾기

이전대상기술

밀집 연결된 하이브리드 뉴럴 네트워크를 이용한 음성 처리 장치 및 방법

  • 기술번호 : KST2020016282
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 밀집 연결된 하이브리드 뉴럴 네트워크를 이용한 음성 처리 장치 및 방법이 개시된다. 음성 처리 방법은 N*1 차원의 입력 음성에 대한 시간 도메인 샘플을 밀집 연결된 하이브리드 네트워크에 입력하는 단계; 상기 시간 도메인 샘플들을 밀집 연결된 하이브리드 네트워크를 구성하는 복수의 밀집 블록(dense block)들에 통과시키는 단계; 상기 시간 도메인 샘플들을 상기 복수의 밀집 블록(dense block)들에 통과시켜 M개의 서브 프레임들로 리쉐이핑하는 단계; 상기 M개의 서브 프레임들을 N/M 차원의 GRU(gated recurrent unit) 컴포넌트들에 입력하는 단계; 및 상기 M개의 서브 프레임들을 GRU 컴포넌트들에 통과시킴으로써 상기 입력 음성 신호에 대해 노이즈가 제거된 클린 음성을 출력하는 단계를 포함할 수 있다.
Int. CL G10L 21/0208 (2013.01.01) G10L 21/0224 (2013.01.01) G10L 25/30 (2013.01.01) G06N 3/08 (2006.01.01)
CPC G10L 21/0208(2013.01) G10L 21/0208(2013.01) G10L 21/0208(2013.01) G10L 21/0208(2013.01)
출원번호/일자 1020200054733 (2020.05.07)
출원인 한국전자통신연구원, 더 트러스티즈 오브 인디애나 유니버시티
등록번호/일자
공개번호/일자 10-2020-0129058 (2020.11.17) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 미국  |   62/844,619   |   2019.05.07
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.10.26)
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
2 더 트러스티즈 오브 인디애나 유니버시티 미국 미국 인디애나 ***** 인디애나폴리스 인디애나 애비뉴

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김민제 미국 ***** 인디애나
2 이미숙 대전광역시 유성구
3 백승권 대전광역시 유성구
4 성종모 대전광역시 유성구
5 이태진 대전광역시 유성구
6 최진수 대전광역시 유성구
7 카이 젠 미국 ***** 인디애나주

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.05.07 수리 (Accepted) 1-1-2020-0464427-14
2 우선권주장증명서류제출서(USPTO)
Submission of Priority Certificate(USPTO)
2020.05.12 수리 (Accepted) 9-1-2020-9004233-68
3 [심사청구]심사청구서·우선심사신청서
2020.10.26 수리 (Accepted) 1-1-2020-1133876-50
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
N*1 차원의 입력 음성에 대한 시간 도메인 샘플을 밀집 연결된 하이브리드 네트워크에 입력하는 단계;상기 시간 도메인 샘플들을 밀집 연결된 하이브리드 네트워크를 구성하는 복수의 밀집 블록(dense block)들에 통과시키는 단계;상기 시간 도메인 샘플들을 상기 복수의 밀집 블록(dense block)들에 통과시켜 M개의 서브 프레임들로 리쉐이핑하는 단계;상기 M개의 서브 프레임들을 N/M 차원의 GRU(gated recurrent unit) 컴포넌트들에 입력하는 단계;상기 M개의 서브 프레임들을 GRU 컴포넌트들에 통과시킴으로써 상기 입력 음성 신호에 대해 노이즈가 제거된 클린 음성을 출력하는 단계를 포함하고,상기 밀집 연결된 하이브리드 네트워크는 컨볼루션 신경망(Convoulution Neural Netrowk: CNN)과 반복 신경망(recurrent neural networks: RNN))이 조합된 네트워크인 음성 처리 방법
2 2
제1항에 있어서,상기 밀집 연결된 하이브리드 네트워크는, 복수의 밀집 블록들을 포함하고,상기 밀집 블록들 각각은, 복수의 컨볼루션 계층으로 구성되는 음성 처리 방법
3 3
제1항에 있어서,상기 N*1 차원의 시간 도메인 샘플은, N*D 차원 내지 N*MD 차원의 컨볼루션 계층들로 확장되며, 상기 N*D 차원 내지 N*MD 차원의 컨볼루션 계층들 각각은 연결될 수 있으며,상기 D는 확장율을 의미하고, M은 상기 밀집 블록을 구성하는 컨볼루션 계층의 개수인 음성 처리 방법
4 4
제1항에 있어서,상기 밀집 연결된 하이브리드 네트워크에 포함된 복수의 밀집 블록들 각각은, 서로 동일한 컨볼루션 계층들을 가짐으로써 반복 신경망으로 표현되는 음성 처리 방법
5 5
제1항에 있어서,상기 밀집 연결된 하이브리드 네트워크의 가장 마지막 밀집 블록의 출력은 M개의 서브 프레임으로 리쉐이핑되고,상기 M개의 서브 프레임은, N/M 차원의 GRU 컴포넌트들에 입력되는 음성 처리 방법
6 6
제1항에 있어서,상기 밀집 블록들 각각은, 1D 컨볼루션 연산을 수행함으로써 피쳐와 채널로 조합된 형태의 데이터 텐서를 출력하는 음성 처리 방법
7 7
제1항에 있어서,상기 밀집 블록들 각각은, 확장률에 따라 1D 컨볼루션 연산 또는 확장된 컨볼루션 연산을 수행하는 음성 처리 방법
8 8
제1항에 있어서,상기 GRU 컴포넌트들은, 제1 히든 스테이트와 제2 히든 스테이트를 업데이트 게이트에 의해 혼합된 형태로 음성을 향상시키는 음성 처리 방법
9 9
제8항에 있어서,상기 제2 히든 스테이트는, 상기 GRU 컴포넌트의 입력과 게이트된 이전 히든 스테이트인 제1 히든 스테이트의 선형 조합을 이용하여 결정되는 음성 처리 방법
10 10
음성 처리 장치에 있어서,상기 음성 처리 장치는, 프로세서를 포함하고,상기 프로세서는, N*1 차원의 입력 음성에 대한 시간 도메인 샘플을 밀집 연결된 하이브리드 네트워크에 입력하고,상기 시간 도메인 샘플들을 밀집 연결된 하이브리드 네트워크를 구성하는 복수의 밀집 블록(dense block)들에 통과시키고,상기 시간 도메인 샘플들을 상기 복수의 밀집 블록(dense block)들에 통과시켜 M개의 서브 프레임들로 리쉐이핑하고,상기 M개의 서브 프레임들을 N/M 차원의 GRU(gated recurrent unit) 컴포넌트들에 입력하고,상기 M개의 서브 프레임들을 GRU 컴포넌트들에 통과시킴으로써 상기 입력 음성 신호에 대해 노이즈가 제거된 클린 음성을 출력하며,상기 밀집 연결된 하이브리드 네트워크는 컨볼루션 신경망(Convoulution Neural Netrowk: CNN)과 반복 신경망(recurrent neural networks: RNN))이 조합된 네트워크인 음성 처리 장치
11 11
제10항에 있어서,상기 밀집 연결된 하이브리드 네트워크는, 복수의 밀집 블록들을 포함하고,상기 밀집 블록들 각각은, 복수의 컨볼루션 계층으로 구성되는 음성 처리 장치
12 12
제10항에 있어서,상기 N*1 차원의 시간 도메인 샘플은, N*D 차원 내지 N*MD 차원의 컨볼루션 계층들로 확장되며, 상기 N*D 차원 내지 N*MD 차원의 컨볼루션 계층들 각각은 연결될 수 있으며,상기 D는 확장율을 의미하고, M은 상기 밀집 블록을 구성하는 컨볼루션 계층의 개수인 음성 처리 장치
13 13
제10항에 있어서,상기 밀집 연결된 하이브리드 네트워크에 포함된 복수의 밀집 블록들 각각은, 서로 동일한 컨볼루션 계층들을 가짐으로써 반복 신경망으로 표현되는 음성 처리 장치
14 14
제10항에 있어서,상기 밀집 연결된 하이브리드 네트워크의 가장 마지막 밀집 블록의 출력은 M개의 서브 프레임으로 리쉐이핑되고,상기 M개의 서브 프레임은, N/M 차원의 GRU 컴포넌트들에 입력되는 음성 처리 장치
15 15
제10항에 있어서,상기 밀집 블록들 각각은, 1D 컨볼루션 연산을 수행함으로써 피쳐와 채널로 조합된 형태의 데이터 텐서를 출력하는 음성 처리 장치
16 16
제10항에 있어서,상기 밀집 블록들 각각은, 확장률에 따라 1D 컨볼루션 연산 또는 확장된 컨볼루션 연산을 수행하는 음성 처리 장치
17 17
제10항에 있어서,상기 GRU 컴포넌트들은, 제1 히든 스테이트와 제2 히든 스테이트를 업데이트 게이트에 의해 혼합된 형태로 음성을 향상시키는 음성 처리 장치
18 18
제17항에 있어서,상기 제2 히든 스테이트는, 상기 GRU 컴포넌트의 입력과 게이트된 이전 히든 스테이트인 제1 히든 스테이트의 선형 조합을 이용하여 결정되는 음성 처리 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 ETRI 연구개발지원사업 초실감 테라미디어를 위한 AV부호화 및 LF미디어 원천기술 개발