맞춤기술찾기

이전대상기술

음성 인식 시스템 및 방법(SYSTEM AND METHOD FOR RECOGNIZING SPEECH)

  • 기술번호 : KST2018003075
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른 자동 음소 생성이 가능한 음성 인식 방법은 음성 데이터의 특징 벡터를 비지도 학습하는 단계; 상기 비지도 학습 결과에 기초하여 선정된 음향학적 특성을 클러스터링하여 음소 세트를 생성하는 단계; 상기 생성된 음소 세트에 기초하여 상기 음성 데이터에 음소열을 할당하는 단계 및 상기 음소열이 할당된 음성 데이터 및 상기 음소열에 기초하여 음향 모델을 생성하는 단계를 포함한다.
Int. CL G10L 15/02 (2006.01.01) G10L 15/06 (2006.01.01) G10L 25/30 (2013.01.01)
CPC
출원번호/일자 1020170047408 (2017.04.12)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2018-0028893 (2018.03.19) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020160116527   |   2016.09.09
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.04.11)
심사청구항수 19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김동현 대한민국 대전광역시 유성구
2 이영직 대한민국 대전광역시 유성구
3 김상훈 대한민국 대전광역시 유성구
4 김승희 대한민국 대전광역시 유성구
5 이민규 대한민국 대전광역시 유성구
6 최무열 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.04.12 수리 (Accepted) 1-1-2017-0357474-80
2 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2018.04.11 수리 (Accepted) 1-1-2018-0362506-16
3 의견제출통지서
Notification of reason for refusal
2019.08.14 발송처리완료 (Completion of Transmission) 9-5-2019-0586060-12
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.10.14 수리 (Accepted) 1-1-2019-1040763-27
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.10.14 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-1040765-18
6 등록결정서
Decision to grant
2020.02.24 발송처리완료 (Completion of Transmission) 9-5-2020-0136649-30
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
자동 음소 생성이 가능한 음성 인식 방법에 있어서,음성 데이터의 특징 벡터를 비지도 학습하는 단계;상기 비지도 학습 결과에 기초하여 선정된 음향학적 특성을 클러스터링하여 음소 세트를 생성하는 단계;상기 생성된 음소 세트에 기초하여 상기 음성 데이터에 음소열을 할당하는 단계;상기 음소열이 할당된 음성 데이터 및 상기 음소열에 기초하여 음향 모델을 생성하는 단계; 및상기 음향 모델 및 언어 네트워크가 적용된 음성인식 디코더를 통해 음싱 인식 결과를 생성하는 단계를 포함하는 음성 인식 방법
2 2
제 1 항에 있어서,상기 음성 데이터는 비전사 음성 데이터인 것인 음성 인식 방법
3 3
제 2 항에 있어서,상기 음성 데이터의 특징 벡터를 비지도 학습하는 단계는,상기 음성 데이터로부터 상기 특징벡터를 추출하는 단계;상기 추출된 특징벡터를 비지도 학습하는 단계 및상기 비지도 학습 결과에 기초하여 상기 특징벡터에 대응하는 음향학적 패턴을 포함하는 인공 신경망을 생성하는 단계를 포함하는 음성 인식 방법
4 4
제 3 항에 있어서,상기 음성 데이터로부터 특징벡터를 추출하는 단계는,상기 음성 데이터를 스펙트로그램으로 변환하는 단계;상기 스펙트로그램으로 변환된 음성 데이터를 기 설정된 시간 프레임 단위의 멜-스케일 필터뱅크(mel-scale filterbank)로 변환시켜 제 1 특징벡터를 생성하는 단계 및상기 제 1 특징벡터를 좌우로 기 설정된 프레임 수만큼의 윈도우를 스플라이싱(splicing)하여 제 2 특징벡터를 생성하는 단계를 포함하되,상기 생성된 제 2 특징벡터를 상기 특징벡터로 추출하는 것인 음성 인식 방법
5 5
제 4 항에 있어서,상기 추출된 특징벡터를 비지도 학습하는 단계는,상기 추출된 특징벡터를 적층 오토인코더(stacked autoencoder)의 입력 노드 및 출력 노드에 배치시켜 상기 특징벡터를 비지도 학습하는 것인 음성 인식 방법
6 6
제 3 항에 있어서,상기 음성 데이터로부터 특징벡터를 추출하는 단계는,상기 음성 데이터를 스펙트로그램으로 변환하는 단계 및상기 스펙트로그램으로 변환된 음성 데이터를 x 프레임 기준의 2차원 단위로 그룹화하여 특징 매트릭스를 생성하는 단계를 포함하되,상기 생성된 특징 매트릭스를 상기 특징벡터로 추출하는 것인 음성 인식 방법
7 7
제 6 항에 있어서,상기 추출된 특징벡터를 비지도 학습하는 단계는,상기 추출된 특징벡터를 합성곱 오토인코더(convolutional autoencoder)의 입력 노드 및 출력 노드에 배치시켜 상기 특징벡터를 비지도 학습하는 것인 음성 인식 방법
8 8
제 3 항에 있어서,상기 비지도 학습 결과에 기초하여 선정된 음향학적 특성을 클러스터링하여 음소 세트를 생성하는 단계는,상기 인공 신경망의 매 입력 데이터에 대한 출력값을 나열하여 상기 음소 세트를 생성하는 것인 음성 인식 방법
9 9
제 8 항에 있어서,상기 음소 세트를 생성하는 단계는,상기 매 입력 데이터에 대한 출력값을 벡터로 표현하여 나열하는 단계;상기 나열된 벡터 중 벡터 클러스터링에 기초하여 벡터간 거리가 특정 경계값 이하인 벡터들을 추출하는 단계;상기 추출된 벡터들을 평균화하여 그룹 벡터를 생성하는 단계 및상기 나열된 벡터 및 생성된 그룹 벡터에 기초하여 상기 음소 세트를 생성하는 단계를 포함하는 음성 인식 방법
10 10
제 8 항에 있어서,상기 음소 세트를 생성하는 단계는,상기 매 입력 데이터에 대한 출력값으로 노드의 인덱스를 나열하는 단계 및상기 나열된 인덱스 중 출력 빈도가 기 설정된 횟수 이상인 인덱스를 중심으로 상기 클러스터링을 수행하여 상기 음소 세트를 생성하는 단계를 포함하는 음성 인식 방법
11 11
제 8 항에 있어서,상기 음성 데이터에 음소열을 할당하는 단계는,상기 인공 신경망에 기초하여 후보 음소열을 나열하는 단계 및상기 생성된 음소 세트와 상기 후보 음소열에 기초하여 최종 음소열을 추출하여 상기 음성 데이터에 상기 최종 음소열을 할당하는 단계를 포함하는 음성 인식 방법
12 12
제 11 항에 있어서,상기 음향 모델을 생성하는 단계는,상기 음소열이 재할당된 음성 데이터 및 상기 음소열을 이용하여 문맥 독립적인 음소열 모델을 생성하는 단계;상기 문맥 독립적인 음소열 모델 및 상기 음소열의 문맥에 따른 조합에 기초하여 문맥 의존 트리를 생성하는 단계;상기 문맥 의존 트리에 기초하여 문맥 의존 음소에 대한 문맥 의존 상태를 정의하는 단계;상기 음소열을 이용하여 상기 음성 데이터에 상기 정의된 문맥 의존 상태를 할당하는 단계 및상기 할당된 문맥 의존 상태의 정보와 상기 음성 데이터에 기초하여 상기 문맥 의존 상태를 학습시키는 단계를 포함하는 음성 인식 방법
13 13
제 12 항에 있어서,상기 문맥 의존 상태를 학습시키는 단계는,상기 학습된 문맥 의존 상태의 모델들을 상기 음성 데이터에 재할당시키는 단계 및상기 재할당된 문맥 의존 상태의 정보와 상기 음성 데이터에 기초하여 상기 재할당된 문맥 의존 상태를 학습시키는 단계를 포함하는 음성 인식 방법
14 14
제 1 항에 있어서,전사 음성 데이터에 기초하여 어절 단위의 발음사전을 생성하는 단계를 더 포함하되,상기 발음사전을 생성하는 단계는,전사 음성 데이터를 어절단위의 구간으로 분할하는 단계;상기 어절단위로 분할된 전사 음성 데이터에 상기 음소열을 할당하는 단계;상기 음소열이 할당된 전사 음성 데이터의 어절에 대응하는 음소열을 정렬하는 단계;상기 정렬된 음소열을 시간축 및 프레임 횟수에 기초하여 정제하는 단계 및상기 정제된 음소열에 기초하여 상기 어절 단위의 발음사전을 생성하는 단계를 포함하는 음성 인식 방법
15 15
제 14 항에 있어서,상기 어절 단위의 발음사전을 생성하는 단계는,상기 전사 음성 데이터의 어절을 분할하여 생성된 부분 어절 또는 음절 단위의 발음사전을 생성하는 것인 음성 인식 방법
16 16
제 15 항에 있어서,학습 코퍼스에 의해 생성된 어절기반의 언어모델을 상기 생성된 발음사전과 연동시키는 단계 및상기 연동 결과에 의해 상기 언어 네트워크를 생성하는 단계를 더 포함하는 음성 인식 방법
17 17
제 16 항에 있어서,상기 발음사전과 연동시키는 단계는,상기 언어모델의 단어 중 상기 어절단위의 발음사전에 포함되지 않은 단어들은 상기 부분 어절 또는 음절 단위의 발음사전과 연동하여 상기 어절단위의 발음사전을 확장하는 단계를 포함하는 음성 인식 방법
18 18
제 16 항에 있어서,사용자에 의해 입력된 음성 데이터로부터 특징 벡터를 추출하는 단계;상기 생성된 음향 모델 및 상기 언어 네트워크가 적용된 상기 음성인식 디코더에 상기 특징 벡터를 입력시키는 단계 및상기 입력 결과에 기초하여 상기 입력된 음성 데이터의 단어열을 추출하여 상기 음성 인식 결과를 생성하는 단계를 더 포함하는 음성 인식 방법
19 19
자동 음소 생성이 가능한 음성 인식 시스템에 있어서,음성 인식을 위한 프로그램이 저장된 메모리 및상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함하되,상기 프로세서는 상기 프로그램을 실행시킴에 따라, 비전사 음성 데이터로부터 특징 벡터를 추출하여 비지도 학습을 수행하고, 상기 비지도 학습 결과에 기초하여 선정된 음향학적 특성을 클러스터링하여 음소 세트를 생성하며, 상기 생성된 음소 세트에 기초하여 상기 음성 데이터에 음소열을 할당하며, 상기 음소열이 할당된 음성 데이터 및 상기 음소열에 기초하여 음향 모델을 생성하고, 상기 음향 모델 및 언어 네트워크가 적용된 음성인식 디코더를 통해 음싱 인식 결과를 생성하는 것인 음성 인식 시스템
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US10249294 US 미국 FAMILY
2 US20180075844 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
DOCDB 패밀리 정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 정부출연금 한국전자통신연구원 정부출연금사업(기관고유사업) 언어장벽 없는 국가 구현을 위한 자동통번역 산업 경쟁력 강화 사업