맞춤기술찾기

이전대상기술

음성인식을 위한 초벌학습 장치 및 방법(PRE-TRAINING APPARATUS AND METHOD FOR SPEECH RECONGINTION)

  • 기술번호 : KST2017015147
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 목적은, 심층 신경회로망을 계층별로 초기화하여, 노드 연결 가중치를 보정할 수 있는, 음성인식을 위한 초벌학습 장치 및 방법을 제공하는 것이다. 이를 위해, 본 발명에 따른 음성인식을 위한 초벌학습 장치는, 음성 데이터를 입력 받는 입력부; 상기 음성 데이터의 연결 가중치를 초기화하는 모델 생성부; 및 상기 연결 가중치에 대한 정보를 출력하는 출력부를 포함하고, 상기 모델 생성부는, 상기 음성 데이터에 대응하는 음소 결과가 출력될 수 있도록, 각 계층들 사이에서, 출력 계층을 적용해, 각 계층에서의 연결 가중치를 보정하여 상기 연결 가중치를 초기화한다.
Int. CL G10L 15/16 (2016.04.22) G10L 15/18 (2016.04.22) G10L 15/20 (2016.04.22) G10L 15/14 (2016.04.22) G06N 3/02 (2016.04.22)
CPC G10L 15/16(2013.01) G10L 15/16(2013.01) G10L 15/16(2013.01) G10L 15/16(2013.01) G10L 15/16(2013.01)
출원번호/일자 1020160032811 (2016.03.18)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2017-0108620 (2017.09.27) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정호영 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.03.18 수리 (Accepted) 1-1-2016-0263096-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 데이터를 입력 받는 입력부;상기 음성 데이터의 연결 가중치를 초기화하는 모델 생성부; 및 상기 연결 가중치에 대한 정보를 출력하는 출력부를 포함하고, 상기 모델 생성부는, 상기 음성 데이터에 대응하는 음소 결과가 출력될 수 있도록, 결정된 심층 신경회로망 구조에 따라 은닉 계층을 쌓으면서 상기 연결 가중치를 학습하고, 각 계층들 사이에, 출력 계층을 적용해, 각 계층에서의 상기 학습된 연결 가중치를 보정하여, 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
2 2
제 1 항에 있어서,상기 출력 계층은 음소 유닛별 스테이트와 직접 매핑되는 음성인식을 위한 초벌학습 장치
3 3
제 1 항에 있어서,상기 모델 생성부는, 은닉 계층들을 쌓아 올려 심층 구조를 형성할 때, 하나의 은닉 계층에 출력 계층을 적용하여 하나의 상기 은닉 계층의 연결 가중치를 보정하고, 상기 출력 계층을 제거한 후, 또 다른 은닉 계층을 쌓고, 상기 또 다른 은닉 계층에 상기 출력 계층을 적용하여, 상기 또 다른 은닉 계층의 연결 가중치를 보정하며,상기 과정을 마지막 은닉 계층까지 반복하여 각 은닉 계층의 연결 가중치를 보정하여 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
4 4
제 1 항에 있어서,상기 모델 생성부는,상기 음성 데이터들이 입력되는 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 출력 계층을 이용해 초기화하고,상기 제1은닉 계층과 상기 제1은닉 계층 위에 쌓인 제2은닉 계층 사이의 제2연결 가중치를 출력 계층을 이용해 초기화하며,상기 과정들을 최종 은닉 계층까지 반복하여, 각 은닉 계층에서의 연결 가중치를 초기화시키는 음성인식을 위한 초벌학습 장치
5 5
제 4 항에 있어서,상기 모델 생성부는 상기 제1연결 가중치를 초기화하기 위해,상기 음성 데이터를 프레임 특징 벡터로 변환시키고, 적어도 2개 이상의 프레임들을 구성하는 프레임 특징 벡터들의 집합인 입력 프레임 묶음을, 입력 계층에 입력시키고,상기 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 최대 엔트로피 방식을 이용하여 결정하며,상기 제1은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제1연결 가중치를 보정하여 상기 제1연결 가중치를 초기화하는 음성인식을 위한 초벌학습 장치
6 6
제 5 항에 있어서,상기 모델 생성부는 상기 제2연결 가중치를 초기화하기 위해,상기 제1연결 가중치가 보정된 후, 상기 출력 계층을 제거하고, 상기 제1은닉 계층 위에, 제2은닉 계층을 쌓고, 상기 제1연결 가중치를 이용하여, 상기 제1은닉 계층의 각 노드에서의 값을 계산하며, 최대 엔트로피 방식을 이용하여, 상기 제1은닉 계층과 상기 제2은닉 계층 사이의 제2연결 가중치를 결정하며,상기 제2은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제2연결 가중치를 보정하는 음성인식을 위한 초벌학습 장치
7 7
제 1 항에 있어서,상기 입력부는,유선 네트워크 또는 무선 네트워크를 통해 통신을 수행하여 상기 음성 데이터를 입력 받거나, 저장매체로부터 상기 음성 데이터를 입력 받거나, 또는 음성을 직접 입력 받은 후 상기 음성을 디지털화시켜 상기 음성 데이터로 변환시키는 음성인식을 위한 초벌학습 장치
8 8
음성 데이터를 입력 받는 단계; 및상기 음성 데이터의 연결 가중치를 초기화하는 단계를 포함하고, 상기 연결 가중치를 초기화하는 단계는,상기 음성 데이터에 대응하는 음소 결과가 출력될 수 있도록, 결정된 심층 신경회로망 구조에 따라 은닉 계층을 쌓으면서 상기 연결 가중치를 학습하고, 상기 각 은닉 계층들 사이에, 출력 계층을 적용해, 상기 각 계층에서의 상기 학습된 연결 가중치를 보정하여 상기 연결 가중치를 초기화하는 음성인식을 위한 초벌학습 방법
9 9
제 8 항에 있어서,상기 연결 가중치를 초기화하는 단계는, 은닉 계층들을 쌓아 올려 심층 구조를 형성할 때, 하나의 은닉 계층에 출력 계층을 적용하여 하나의 상기 은닉 계층의 연결 가중치를 보정하는 단계; 상기 출력 계층을 제거한 후, 또 다른 은닉 계층을 쌓는 단계; 상기 또 다른 은닉 계층에 상기 출력 계층을 적용하여, 상기 또 다른 은닉 계층의 연결 가중치를 보정하는 단계; 및상기 과정을 마지막 은닉 계층까지 반복하여 각 은닉 계층의 연결 가중치를 초기화하는 단계를 포함하는 음성인식을 위한 초벌학습 방법
10 10
제 8 항에 있어서,상기 연결 가중치를 초기화하는 단계는,상기 음성 데이터들이 입력되는 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 출력 계층을 이용해 초기화하는 단계;상기 제1은닉 계층과 상기 제1은닉 계층 위에 쌓인 제2은닉 계층 사이의 제2연결 가중치를 상기 출력 계층을 이용해 초기화하는 단계; 및상기 과정들을 최종 은닉 계층까지 반복하여, 각 은닉 계층에서의 연결 가중치를 초기화시키는 단계를 포함하는 음성인식을 위한 초벌학습 방법
11 11
제 10 항에 있어서,상기 제1연결 가중치를 초기화하는 단계는,상기 음성 데이터를 프레임 특징 벡터로 변환시키고, 적어도 2개 이상의 프레임들을 구성하는 프레임 특징 벡터들의 집합인 입력 프레임 묶음을, 입력 계층에 입력시키는 단계;상기 입력 계층과 상기 입력 계층 위에 쌓인 제1은닉 계층 사이의 제1연결 가중치를 최대 엔트로피 방식을 이용하여 결정하는 단계; 및상기 제1은닉 계층 위에 출력 계층을 쌓고, 상기 입력 프레임 묶음에 대응하는 음소 유닛의 스테이트가 출력되도록 상기 제1연결 가중치를 보정하는 단계를 포함하는 음성인식을 위한 초벌학습 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US09875737 US 미국 FAMILY
2 US20170270910 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2017270910 US 미국 DOCDBFAMILY
2 US9875737 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 보이스웨어 SW컴퓨팅산업원천기술개발 녹음/녹취 데이터용 음성 인식 기술 및 시스템 개발