1 |
1
음성 합성 장치가 음성 합성을 수행하는 방법에 있어서데이터 베이스로부터 음성데이터들을 입력 받고, 상기 음성데이터들로부터 파라미터들을 추출하는 단계; 상기 음성데이터들을 기초로 유사 증강 데이터들을 생성하는 단계; 상기 음성데이터들과 상기 유사 증강 데이터들에 기초하여 음성합성 모델을 훈련하는 단계; 및텍스트를 입력 받고, 상기 음성합성 모델을 사용하여 음성을 합성하여 출력하는 단계; 를 포함하되,상기 유사 증강 데이터를 생성하는 경우 감정 조절 벡터를 생성하고, 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여,적어도 하나 이상의 상기 유사 증강 데이터를 생성하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
2 |
2
제 1 항에 있어서상기 감정 조절 벡터는상기 유사데이터 생성모델의 입력으로 사용되는 확률 변수를 제어함으로써 감정 표현의 방법이나 감정 표현의 강도를 조절하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
3 |
3
제 1 항에 있어서상기 생성된 적어도 하나 이상의 데이터는상기 음성데이터와 유사한 확률 분포를 갖는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
4 |
4
제 1 항에 있어서상기 유사데이터 생성모델은 상기 음성데이터들의 파라미터들을 입력 받아 훈련되는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
5 |
5
제 1 항에 있어서상기 유사데이터 생성모델은 상기 음성데이터들로부터 추출한 파라미터들의 확률 분포를 통계적으로 모델링하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
6 |
6
제 1 항에 있어서상기 유사데이터 생성모델을 훈련하는 경우, VAE (Variational Auto Encoder)를 이용하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
7 |
7
제 1 항에 있어서상기 음성데이터의 파라미터를 입력 받아 감정 조절 모델이 훈련되고,상기 훈련된 감정 조절 모델은 랜덤 변수를 입력 받아 상기 감정 조절 벡터를 생성하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
8 |
8
제 1 항에 있어서상기 음성합성 모델을 훈련하는 경우, 상기 음성데이터들로부터 추출된 파라미터들 및 유사 증강데이터들로부터 추출된 파라미터들에 기초하여 상기 음성합성 모델을 훈련하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
9 |
9
제 1 항에 있어서음성합성 모델을 훈련하는 경우, 언어 및 음성 파라미터 간의 매핑 (mapping) 관계에 대한 정보를 저장하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
10 |
10
제 9 항에 있어서상기 텍스트를 입력 받은 경우,상기 음성합성 모델에 저장된 언어 및 음성 파라미터 간의 매핑 (mapping) 관계에 대한 정보에 기초하여, 상기 텍스트에 대응되는 음성 파라미터를 추정하여 음성 파형을 합성하여 출력하는 것을 특징으로 하는 음성 합성을 수행하는 방법
|
11 |
11
음성합성 장치에 있어서데이터 베이스로부터 음성데이터들을 입력 받고, 상기 음성데이터들로부터 파라미터들을 추출하는 파라미터 추출부;상기 음성데이터들을 기초로 유사 증강 데이터들을 생성하는 유사 데이터 생성부; 상기 음성데이터들과 상기 유사 증강 데이터들에 기초하여 음성합성 모델을 훈련하는 음성합성 모델 훈련부; 및텍스트를 입력 받고, 상기 음성합성 모델을 사용하여 음성을 합성하여 출력하는 음성 합성부; 를 포함하되,상기 유사 데이터 생성부가 상기 유사 증강 데이터를 생성하는 경우 감정 조절 벡터를 생성하고, 유사데이터 생성모델(generative model)에 상기 감정 조절 벡터를 입력하여,적어도 하나 이상의 데이터를 추가로 생성하는 것을 특징으로 하는 음성합성 장치
|
12 |
12
제 11 항에 있어서상기 감정 조절 벡터는상기 유사데이터 생성모델의 입력으로 사용되는 확률 변수를 제어함으로써 감정 표현의 방법이나 감정 표현의 강도를 조절하는 것을 특징으로 하는 음성합성 장치
|
13 |
13
제 11 항에 있어서상기 생성된 적어도 하나 이상의 데이터는상기 음성데이터와 유사한 확률 분포를 갖는 것을 특징으로 하는 음성합성 장치
|
14 |
14
제 11 항에 있어서상기 유사데이터 생성모델은 상기 음성데이터들의 파라미터들을 입력 받아 훈련되는 것을 특징으로 하는 음성합성 장치
|
15 |
15
제 11 항에 있어서상기 유사데이터 생성모델은 상기 음성데이터들로부터 추출한 파라미터들의 확률 분포를 통계적으로 모델링하는 것을 특징으로 하는 음성합성 장치
|
16 |
16
제 11 항에 있어서상기 유사데이터 생성모델을 훈련하는 경우, VAE (Variational Auto Encoder)를 이용하는 것을 특징으로 하는 음성합성 장치
|
17 |
17
제 1 항에 있어서제어 벡터 생성부;를 더 포함하되,상기 음성데이터의 파라미터를 입력 받아 감정 조절 모델이 훈련되고,상기 훈련된 감정 조절 모델은 랜덤 변수를 입력 받아 상기 감정 조절 벡터를 생성하는 것을 특징으로 하는 음성합성 장치
|
18 |
18
제 1 항에 있어서상기 음성합성 모델을 훈련하는 경우, 상기 음성데이터들로부터 추출된 파라미터들 및 유사 증강데이터들로부터 추출된 파라미터들에 기초하여 상기 음성합성 모델을 훈련하는 것을 특징으로 하는 음성합성 장치
|
19 |
19
제 11 항에 있어서음성합성 모델을 훈련하는 경우, 언어 및 음성 파라미터 간의 매핑 (mapping) 관계에 대한 정보를 저장하는 것을 특징으로 하는 음성합성 장치
|
20 |
20
제 19 항에 있어서음성 파라미터 생성부;를 더 포함하고,상기 텍스트를 입력 받은 경우,상기 음성합성 모델에 저장된 언어 및 음성 파라미터 간의 매핑 (mapping) 관계에 대한 정보에 기초하여, 상기 음성 파라미터 생성부는 상기 텍스트에 대응되는 음성 파라미터를 추정하고,음성 합성부는 상기 추정된 음성 파라미터에 기초하여 음성 파형을 합성하여 출력하는 것을 특징으로 하는 음성합성 장치
|