1 |
1
원본 화자 및 변환 대상 음성 데이터를 수집하는 단계; VAE(variational autoencoder)의 인코더 및 디코더를 이용하여 원본 화자 음성(A)을 변환 대상 화자 음성(B’)으로 변환하는 단계; 상기 인코더 및 디코더를 이용하여 상기 변환 대상 화자 음성(B’)을 복원 음성(A’)으로 변환하는 단계; 및 상기 원본 음성(A)과 상기 복원 음성(A’)을 비교하여 상기 원본 음성(A)과 상기 복원 음성(A’)의 차이가 줄어들도록 상기 디코더를 학습시키는 단계를 포함하는 것을 특징으로 하는 음성 변환 방법
|
2 |
2
제1항에 있어서, 상기 원본 화자 음성(A)은 복수 화자 음성에 대한 병렬 데이터이고, 상기 변환 대상 화자 음성(B’)은 복수 화자의 음성에 각각 대응되는 복수의 변환 대상 화자 음성에 대한 병렬 데이터인 것을 특징으로 하는 음성 변환 방법
|
3 |
3
제2항에 있어서, 상기 디코더는복수 화자에 일대일로 대응될 수 있도록 다중 디코더로 이루어진 것을 특징으로 하는 음성 변환 방법
|
4 |
4
제3항에 있어서, 상기 인코더는복수 화자에 일대일로 대응될 수 있도록 다중 인코더로 이루어진 것을 특징으로 하는 음성 변환 방법
|
5 |
5
원본 화자 및 변환 대상 음성 데이터를 수집하는 음성 수집부; 원본 화자 음성(A)을 입력으로 하여 변환 대상 화자 음성(B’)으로 변환하고, 상기 변환 대상 화자 음성(B’)을 복원 음성(A’)으로 변환하는 VAE(variational autoencoder)의 인코더 및 디코더; 상기 원본 음성(A)과 상기 복원 음성(A’)을 비교하여 상기 원본 음성(A)과 상기 복원 음성(A’)의 차이가 줄어들도록 상기 디코더를 학습시키는 학습부; 및 상기 음성 수집부, 상기 인코더 및 디코더, 상기 학습부를 제어하는 제어부를 포함하는 것을 특징으로 하는 음성 변환 장치
|
6 |
6
제5항에 있어서, 상기 원본 화자 음성(A)은 복수 화자 음성에 대한 병렬 데이터이고, 상기 변환 대상 화자 음성(B’)은 복수 화자의 음성에 각각 대응되는 복수의 변환 대상 화자 음성에 대한 병렬 데이터인 것을 특징으로 하는 음성 변환 장치
|
7 |
7
제6항에 있어서, 상기 디코더는복수 화자에 일대일로 대응될 수 있도록 다중 디코더로 이루어진 것을 특징으로 하는 음성 변환 장치
|
8 |
8
제7항에 있어서, 상기 인코더는복수 화자에 일대일로 대응될 수 있도록 다중 인코더로 이루어진 것을 특징으로 하는 음성 변환 장치
|