1 |
1
컴퓨터 장치가 특정 사용자의 음성 데이터에서 상기 사용자의 음성 특성에 해당하는 특성 벡터를 추출하는 단계;상기 컴퓨터 장치가 사전에 마련한 학습 모델에 상기 특성 벡터 및 외국어 텍스트(text)를 입력하는 단계;상기 컴퓨터 장치가 조절 인자에 대한 특정 값을 상기 학습 모델에 입력하는 단계; 및 상기 컴퓨터 장치가 상기 학습 모델에서 출력하는 값을 이용하여 외국어 음성을 출력하는 단계를 포함하되,상기 조절 인자는 상기 학습 모델에서 음성 합성을 위해 사용되는 파라미터 중 유창성 정도를 조절하는 인자로 사전에 결정되고, 상기 조절 인자는 외국어 유창성의 정도에 따라 서로 다른 값을 갖고, 상기 학습 모델은 입력되는 상기 특정 값에 대응되는 유창성을 갖는 음성을 출력하는 인공 지능 기반 외국어 음성 합성 방법
|
2 |
2
제1항에 있어서,상기 특성 벡터는 상기 사용자의 음성에서 음색(tone)을 나타내는 인공 지능 기반 외국어 음성 합성 방법
|
3 |
3
제1항에 있어서,상기 컴퓨터 장치는 상기 음성 데이터를 사전에 마련한 비지도 학습 모델에 입력하여 파형의 배열 특징에 해당하는 상기 특성 벡터를 추출하는 인공 지능 기반 외국어 음성 합성 방법
|
4 |
4
제1항에 있어서,상기 학습 모델은 RNN(recurrent neural network)인 인공 지능 기반 외국어 음성 합성 방법
|
5 |
5
삭제
|
6 |
6
제1항에 있어서,상기 조절 인자는 음성의 억양 내지 발음을 조절하는 인자이고, 외국어를 사용하는 지역에 따라 서로 다른 값을 갖는 인공 지능 기반 외국어 음성 합성 방법
|
7 |
7
컴퓨터에서 제1항 내지 제4항 및 제6항 중 어느 하나의 항에 기재된 인공 지능 기반 외국어 음성 합성 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|
8 |
8
특정 사용자의 음성 데이터, 외국어 텍스트(text) 및 조절 인자에 대한 특정값을 입력받는 입력장치;상기 음성 데이터에서 음성 특성에 해당하는 특성 벡터를 추출하는 제1 학습 모델 및 상기 특성 벡터, 상기 텍스트 및 상기 조절 인자를 입력받아 외국어 음성을 출력하는 제2 학습 모델을 저장하는 저장장치; 및상기 음성 데이터를 비지도 학습 모델인 상기 제1 학습 모델에 입력하여 파형의 배열 특징에 해당하는 상기 특성 벡터를 추출하고, 상기 특성 벡터, 상기 텍스트 및 상기 조절 인자를 상기 제2 학습 모델에 입력하여 외국어 음성을 생성하는 연산장치를 포함하되,상기 조절 인자는 외국어 유창성의 정도에 따라 서로 다른 값을 갖고, 상기 제2 학습 모델은 입력되는 상기 특정 값에 대응되는 유창성을 갖는 음성을 출력하는 인공 지능 기반 외국어 음성 합성 장치
|
9 |
9
제8항에 있어서,상기 특징 벡터는 상기 사용자의 음성에서 음색(tone)을 나타내는 파형의 배열 특징인 인공 지능 기반 외국어 음성 합성 장치
|
10 |
10
제8항에 있어서,상기 제1 학습 모델은 오토인코더(autoencoder)이고, 상기 제2 학습 모델은 RNN(recurrent neural network)인 인공 지능 기반 외국어 음성 합성 장치
|
11 |
11
삭제
|
12 |
12
제8항에 있어서,상기 조절 인자는 음성의 억양 내지 발음을 조절하는 인자이고, 외국어를 사용하는 지역에 따라 서로 다른 값을 갖는 인공 지능 기반 외국어 음성 합성 장치
|