1 |
1
음성 합성시스템의 텍스트/음성변환기에서 최적 합성단위열 선정 방법에 있어서, 합성음의 명료도와 자연성을 향상시키기 위하여, 트라이폰(Triphone) 단위를 기본 합성단위로 정의하는 제 1 단계; 임의의 어절을 합성하기 위해 입력된 텍스트를 트라이폰 열로 변환하고, 각 트라이폰의 복수 후보 트라이폰을 메모리에 저장하는 제 2 단계; 및 상기 복수 후보 트라이폰중 접합점에서의 왜곡이 최소인 최적 트라이폰을 선정하기 위해, 상기 각 트라이폰의 상태간 경로를 제약해 최소 누적 왜곡을 갖는 최적 경로를 선정하여 상기 합성음을 생성하는 제 3 단계 를 포함하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
2 |
2
제 1 항에 있어서, 상기 제 2 단계는, 외부로부터 텍스트를 입력받는 제 4 단계; 입력된 텍스트에서 임의의 어절을 합성하기 위해 발음변환 규칙을 사용하여 상기 트라이폰열로 변환하는 제 5 단계; 및 합성 데이터베이스로부터 전송된 상기 각 트라이폰의 복수 후보 트라이폰을 상기 메모리에 저장하는 제 6 단계 를 포함하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
3 |
3
제 1 항 또는 제 2 항에 있어서, 상기 제 3 단계는, 상기 각 트라이폰을 비터비 탐색을 수행하여 검색하는 제 7 단계; 및 수행된 비터비 탐색 결과에 따라, 상기 각 트라이폰중 최소 왜곡을 갖는 경로를 선정하여 합성음을 생성하는 제 8 단계 를 포함하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
4 |
4
제 3 항에 있어서, 상기 제 8 단계의 최소 왜곡을 갖는 경로 거리는, 각 상태간 유클리디언 거리(Euclidean distance)를 사용하여 최종 상태까지 누적하되, 유클리디언 거리 계산시 각 특징간 가중치를 가하는 것을 특징으로 하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
5 |
5
제 4 항에 있어서, 상기 가중치는, 실질적으로, 지각 실험에 의해 시행착오로 결정되는 것을 특징으로 하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
6 |
6
제 2 항에 있어서, 상기 제 6 단계의 상기 합성 데이터베이스는, 일 음운환경에는 다른 음소의 경계에 해당하는 켑스트럼값, 피치값, 피치 에너지, 및 지속시간이 저장되고, 다른 음운환경에는 현재 음소의 경계에 해당하는 켑스트럼값, 피치값, 피치 에너지, 및 지속시간이 저장된 다수개의 트라이폰으로 구성되어 합성단위로 사용되며, 음운환경을 이용하여 트라이폰열이 최장일치가 되도록 트라이폰을 선정하고 어절을 합성하는 경우에 음소간 운율변화를 고려할 수 있는 트라이폰을 선정하는 것을 특징으로 하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|
7 |
7
제 3 항에 있어서, 상기 제 7 단계의 비터비 탐색을 수행하는 과정은, 전방향 경로(Forward path) 과정에서 각 상태에서의 트라이폰 복수 후보들이 다음 상태의 트라이폰과 왜곡을 계산하며, 후방향 경로(Backward path)에서 최소 누적 왜곡을 갖는 최적 경로를 탐색하는 것을 특징으로 하는 텍스트/음성변환기에서의 최적 합성단위열 선정 방법
|