맞춤기술찾기

이전대상기술

도메인특화 음성인식 모델 구성 방법 및 장치와 이를 이용한 종단형 음성인식기

  • 기술번호 : KST2023000912
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 원하는 특정 도메인에서의 음성인식 성능을 높일 수 있는 종단형 음성인식 기술에 관한 것으로, 특화를 원하는 도메인의 텍스트 데이터(이하, '도메인 텍스트 데이터')를 수집하고, 상기 수집된 도메인 텍스트 데이터를 상기 기억장소에 포함된 음성-전사문 텍스트 DB(이하, '기본 전사문 텍스트 DB')와 비교하여 이 기본 전사문 텍스트 DB에 포함되지 않아 추가 학습이 필요한 도메인 텍스트를 결정하여 상기 기억장소에 특화 대상 도메인 텍스트 DB를 구축한다. 또한, 상기 특화 대상 도메인 텍스트 DB의 도메인 텍스트로부터 음성신호를 생성하고, 생성된 음성신호로 음성인식 신경망을 학습시켜서 특화를 원하는 도메인에 특화된 종단형 음성인식 모델을 만든다. 이 특화된 음성인식 모델을 종단형 음성인식기에 적용하여 도메인 특화 종단형 음성인식을 수행할 수 있다.
Int. CL G10L 15/183 (2013.01.01) G10L 15/14 (2006.01.01) G10L 15/26 (2006.01.01) G10L 13/02 (2006.01.01) G10L 15/16 (2006.01.01) G06N 3/08 (2023.01.01)
CPC G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01)
출원번호/일자 1020220001723 (2022.01.05)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2023-0106005 (2023.07.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.07.25)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 윤승 대전광역시 유성구
2 김상훈 대전광역시 유성구
3 이민규 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.01.05 수리 (Accepted) 1-1-2022-0014816-64
2 [심사청구]심사청구서·우선심사신청서
2022.07.25 수리 (Accepted) 1-1-2022-0772034-45
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
기억장소 및 프로세서가 포함된 컴퓨터 시스템에서 실행되는 종단형 음성인식 모델 구성 방법에 있어서,상기 프로세서가, 특화를 원하는 도메인의 텍스트 데이터(이하, '도메인 텍스트 데이터')를 수집하고, 상기 수집된 도메인 텍스트 데이터를 상기 기억장소에 포함된 음성-전사문 텍스트 DB(이하, '기본 전사문 텍스트 DB')와 비교하여 이 기본 전사문 텍스트 DB에 포함되지 않아 추가 학습이 필요한 도메인 텍스트를 결정하여 상기 기억장소에 특화대상 도메인 텍스트 DB를 구축하고;상기 프로세서가, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트로부터 특화대상 음성신호를 생성하고, 생성된 특화대상 음성신호로 음성인식 신경망을 학습시켜서 특화를 원하는 도메인에 특화된 종단형 음성인식 모델을 만드는 것을 포함하는 도메인특화 음성인식 모델 구성 방법
2 2
제1항에 있어서, 상기 추가 학습이 필요한 도메인 텍스트는 도메인 텍스트의 출현 빈도가 사전 설정된 임계값 이하일 때 결정되는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
3 3
제1항에 있어서, 상기 수집된 도메인 텍스트 데이터를 상기 기본 전사문 텍스트 DB와 비교하는 것은,상기 수집된 도메인 텍스트에서 비교 후보 텍스트를 추출하여, 이 추출된 비교 후보 텍스트를 상기 기본 전사문 텍스트 DB와 비교하는 것을 포함하는 도메인특화 음성인식 모델 구성 방법
4 4
제1항에 있어서, 상기 특화대상 음성신호의 생성은, 단일 화자 음성합성기 및 다화자 음성합성기 중 하나를 사용하여 이루어지는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
5 5
제1항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 상기 생성된 특화 음성으로 처음부터 음성인식 신경망을 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
6 6
제1항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 기존에 만들어져 있는 일반 음성인식 신경망을 연결학습 및 전이학습 중 하나를 이용하여 추가로 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
7 7
제1항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 생성하는 것을 추가로 포함하는 도메인특화 음성인식 모델 구성 방법
8 8
제1항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 특화 사용자어휘 DB를 구축하는 것을 추가로 포함하는 도메인특화 음성인식 모델 구성 방법
9 9
종단형 음성인식 모델 구성 장치에 있어서,특화를 원하는 도메인의 텍스트 데이터(이하, '도메인 텍스트 데이터')를 수집하고; 상기 수집된 도메인 텍스트 데이터를 음성-전사문 텍스트 DB(이하, '기본 전사문 텍스트 DB')와 비교하여 이 기본 전사문 텍스트 DB에 포함되지 않아 추가 학습이 필요한 도메인 텍스트를 결정하여 특화대상 도메인 텍스트 DB를 생성하고;상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트로부터 특화대상 음성신호를 생성하고;생성된 특화대상 음성신호로 음성인식 신경망을 학습시키는 프로세서를 포함하는 도메인특화 음성인식 모델 구성 장치
10 10
제9항에 있어서, 상기 추가 학습이 필요한 도메인 텍스트는 도메인 텍스트의 출현 빈도가 사전 설정된 임계값 이하일 때 결정되는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
11 11
제9항에 있어서, 상기 수집된 도메인 텍스트 데이터를 상기 기본 전사문 텍스트 DB와 비교하는 것은,상기 수집된 도메인 텍스트에서 비교 후보 텍스트를 추출하여, 이 추출된 비교 후보 텍스트를 상기 기본 전사문 텍스트 DB와 비교하는 것을 포함하는 도메인특화 음성인식 모델 구성 장치
12 12
제9항에 있어서, 상기 특화대상 음성신호의 생성은, 단일 화자 음성합성기 및 다화자 음성합성기 중 하나를 사용하여 이루어지는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
13 13
제9항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 상기 생성된 특화 음성으로 처음부터 음성인식 신경망을 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
14 14
제9항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 기존에 만들어져 있는 일반 음성인식 신경망을 연결학습 및 전이학습 중 하나를 이용하여 추가로 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
15 15
제9항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 추가로 포함하는 도메인특화 음성인식 모델 구성 장치
16 16
제9항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 생성되는 특화 사용자어휘 DB를 추가로 포함하는 도메인특화 음성인식 모델 구성 장치
17 17
청구항 9 내지 청구항 14 중 한 항에 기재된 도메인특화 음성인식 모델 구성 장치에 의해 구성된 도메인특화 음성인식 모델을 포함하는 도메인특화 종단형 음성인식기
18 18
제17항에 있어서, 상기 도메인특화 음성인식 모델은상기 학습된 음성인식 신경망을 이용하여, 입력된 음성신호의 프레임별 인코드 값을 출력하는 음성 입력 인코더; 및 상기 음성인식 신경망을 이용하여, 상기 인코드 값에 대한 어텐션(attention)을 계산하여 최종 문자열을 출력하는 문자열 출력 디코더를 포함하는 도메인특화 종단형 음성인식기
19 19
제17항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 추가로 포함하는 도메인특화 종단형 음성인식기
20 20
제17항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 생성되는 특화 사용자어휘 DB를 추가로 포함하는 도메인특화 종단형 음성인식기
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정부출연금사업(기관고유사업) 자율성장형 복합인공지능 원천기술연구