1 |
1
기억장소 및 프로세서가 포함된 컴퓨터 시스템에서 실행되는 종단형 음성인식 모델 구성 방법에 있어서,상기 프로세서가, 특화를 원하는 도메인의 텍스트 데이터(이하, '도메인 텍스트 데이터')를 수집하고, 상기 수집된 도메인 텍스트 데이터를 상기 기억장소에 포함된 음성-전사문 텍스트 DB(이하, '기본 전사문 텍스트 DB')와 비교하여 이 기본 전사문 텍스트 DB에 포함되지 않아 추가 학습이 필요한 도메인 텍스트를 결정하여 상기 기억장소에 특화대상 도메인 텍스트 DB를 구축하고;상기 프로세서가, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트로부터 특화대상 음성신호를 생성하고, 생성된 특화대상 음성신호로 음성인식 신경망을 학습시켜서 특화를 원하는 도메인에 특화된 종단형 음성인식 모델을 만드는 것을 포함하는 도메인특화 음성인식 모델 구성 방법
|
2 |
2
제1항에 있어서, 상기 추가 학습이 필요한 도메인 텍스트는 도메인 텍스트의 출현 빈도가 사전 설정된 임계값 이하일 때 결정되는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
|
3 |
3
제1항에 있어서, 상기 수집된 도메인 텍스트 데이터를 상기 기본 전사문 텍스트 DB와 비교하는 것은,상기 수집된 도메인 텍스트에서 비교 후보 텍스트를 추출하여, 이 추출된 비교 후보 텍스트를 상기 기본 전사문 텍스트 DB와 비교하는 것을 포함하는 도메인특화 음성인식 모델 구성 방법
|
4 |
4
제1항에 있어서, 상기 특화대상 음성신호의 생성은, 단일 화자 음성합성기 및 다화자 음성합성기 중 하나를 사용하여 이루어지는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
|
5 |
5
제1항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 상기 생성된 특화 음성으로 처음부터 음성인식 신경망을 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
|
6 |
6
제1항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 기존에 만들어져 있는 일반 음성인식 신경망을 연결학습 및 전이학습 중 하나를 이용하여 추가로 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 방법
|
7 |
7
제1항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 생성하는 것을 추가로 포함하는 도메인특화 음성인식 모델 구성 방법
|
8 |
8
제1항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 특화 사용자어휘 DB를 구축하는 것을 추가로 포함하는 도메인특화 음성인식 모델 구성 방법
|
9 |
9
종단형 음성인식 모델 구성 장치에 있어서,특화를 원하는 도메인의 텍스트 데이터(이하, '도메인 텍스트 데이터')를 수집하고; 상기 수집된 도메인 텍스트 데이터를 음성-전사문 텍스트 DB(이하, '기본 전사문 텍스트 DB')와 비교하여 이 기본 전사문 텍스트 DB에 포함되지 않아 추가 학습이 필요한 도메인 텍스트를 결정하여 특화대상 도메인 텍스트 DB를 생성하고;상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트로부터 특화대상 음성신호를 생성하고;생성된 특화대상 음성신호로 음성인식 신경망을 학습시키는 프로세서를 포함하는 도메인특화 음성인식 모델 구성 장치
|
10 |
10
제9항에 있어서, 상기 추가 학습이 필요한 도메인 텍스트는 도메인 텍스트의 출현 빈도가 사전 설정된 임계값 이하일 때 결정되는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
|
11 |
11
제9항에 있어서, 상기 수집된 도메인 텍스트 데이터를 상기 기본 전사문 텍스트 DB와 비교하는 것은,상기 수집된 도메인 텍스트에서 비교 후보 텍스트를 추출하여, 이 추출된 비교 후보 텍스트를 상기 기본 전사문 텍스트 DB와 비교하는 것을 포함하는 도메인특화 음성인식 모델 구성 장치
|
12 |
12
제9항에 있어서, 상기 특화대상 음성신호의 생성은, 단일 화자 음성합성기 및 다화자 음성합성기 중 하나를 사용하여 이루어지는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
|
13 |
13
제9항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 상기 생성된 특화 음성으로 처음부터 음성인식 신경망을 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
|
14 |
14
제9항에 있어서, 상기 특화대상 음성신호로 음성인식 신경망을 학습시키는 것은 기존에 만들어져 있는 일반 음성인식 신경망을 연결학습 및 전이학습 중 하나를 이용하여 추가로 학습시키는 것을 특징으로 하는 도메인특화 음성인식 모델 구성 장치
|
15 |
15
제9항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 추가로 포함하는 도메인특화 음성인식 모델 구성 장치
|
16 |
16
제9항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 생성되는 특화 사용자어휘 DB를 추가로 포함하는 도메인특화 음성인식 모델 구성 장치
|
17 |
17
청구항 9 내지 청구항 14 중 한 항에 기재된 도메인특화 음성인식 모델 구성 장치에 의해 구성된 도메인특화 음성인식 모델을 포함하는 도메인특화 종단형 음성인식기
|
18 |
18
제17항에 있어서, 상기 도메인특화 음성인식 모델은상기 학습된 음성인식 신경망을 이용하여, 입력된 음성신호의 프레임별 인코드 값을 출력하는 음성 입력 인코더; 및 상기 음성인식 신경망을 이용하여, 상기 인코드 값에 대한 어텐션(attention)을 계산하여 최종 문자열을 출력하는 문자열 출력 디코더를 포함하는 도메인특화 종단형 음성인식기
|
19 |
19
제17항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하는 특화 언어모델을 추가로 포함하는 도메인특화 종단형 음성인식기
|
20 |
20
제17항에 있어서, 상기 특화대상 도메인 텍스트 DB의 특화대상 도메인 텍스트의 양을 변화시켜 특화대상 도메인 텍스트의 가중치를 조절하기 위하여 상기 특화대상 도메인 텍스트 DB로부터 특화 사용자 어휘를 추출하여 생성되는 특화 사용자어휘 DB를 추가로 포함하는 도메인특화 종단형 음성인식기
|