1 |
1
삭제
|
2 |
2
음성합성 장치는 텍스트를 입력받아 숫자, 심볼 등을 한글 텍스트 및 음운기호로 변환하는 텍스트 전처리부와,상기 변환된 텍스트를 형태소 품사 태깅을 수행하여 입력 텍스트의 문장 구조를 파악하는 형태소 품사 태깅부와,상기 파악된 텍스트를 합성음이 자연스럽게 생성되도록 복수의 화자들의 억양, 지속시간, 에너지 및 인위적으로 생성된 끊어읽기 규칙들을 적용하고, 이를 독립된 화자의 발성패턴을 재반영하여 운율 파라미터를 생성하는 운율 생성부와,상기 생성된 운율 파라미터를 이용해 음성 텍스트 정보가 기 저장된 합성 DB로부터 화자의 끊어읽기 패턴에 기반하는 합성단위를 선정 및 연결하여 합성음을 생성하는 합성단위 선정부를 포함하되,상기 운율 생성부는 텍스트 기반으로부터 복수의 화자의 발화패턴에 따른 통계적 모델을 저장하는 화자독립 끊어읽기 DB와,텍스트 기반으로부터 독립된 하나의 화자 발성패턴에 따른 모델을 저장하는 화자종속 끊어읽기 모델을 저장하는 화자종속 끊어읽기 DB를 포함하는 것을 특징으로 하는 음성합성을 위한 끊어읽기 장치
|
3 |
3
제 2 항에 있어서,상기 운율 파라미터는 다음 수식으로 생성되는 것을 특징으로 하는 음성합성을 위한 끊어읽기 장치
|
4 |
4
텍스트 전처리 및 형태소 품사 태깅을 수행하여 문장의 끊어읽기에 필요한 특징을 추출하는 단계와,상기 추출된 끊어읽기에 필요한 특징에 기반하여 기 저장된 화자독립 모델 데이터 베이스(DB)로부터 운율요소가 예측되고 이를 통해 적어도 하나 이상의 제 1 끊어읽기 결과와 각 결과의 확률값을 산출하는 단계와,상기 제 1 끊어읽기 결과들 중 산출된 확률값 중 확률값이 높은 순으로 적어도 하나 이상의 제 2 끊어읽기 결과 모델을 추출하는 단계와,상기 추출된 제 2 끊어읽기 결과 모델에 기 저장된 화자종속 모델 데이터 베이스(DB)를 이용하여 화자 발성패턴이 적용된 끊어읽기 결과 모델을 재산정(rescoring)하는 단계를 포함하는 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
5 |
5
제 4 항에 있어서,상기 재산정하여 얻은 확률값 중 가장 큰 확률값을 갖는 1개의 끊어읽기 결과 모델을 출력하는 단계를 더 포함하는 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
6 |
6
제 4 항에 있어서,상기 끊어읽기에 필요한 특징은 문장의 품사, 문장 어절위치, 어절내 음절수, 이전 품사, 이후 품사 중 적어도 하나인 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
7 |
7
제 4 항에 있어서, 상기 화자독립 모델 데이터 베이스(DB)는 발화의 기본단위인 말마디, 말토막에 따라 복수의 화자들의 발화특성의 통계적 특성을 텍스트 기반의 끊어읽기 규칙들로 저장하는 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
8 |
8
제 4 항에 있어서,상기 화자종속 끊어읽기 모델 DB는 발화의 기본단위인 말마디, 말토막에 따라 독립된 한명의 화자의 발화특성이 특성을 텍스트 기반의 끊어읽기 규칙들로 저장하는 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
9 |
9
제 4 항에 있어서,상기 운율요소는 음소의 길이, 크기, 기본주파수 궤적 중 적어도 어느 하나인 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|
10 |
10
제 4 항에 있어서,상기 결과 모델, 산출 및 재산출되는 확률값은 품사 N-gram, HMM(Hidden Marcov Model) 또는 CART(Classification and Regression Tree) 등을 이용하여 모델링되는 통계적 모델을 통해 예측되는 것을 특징으로 하는 음성합성을 위한 끊어읽기 방법
|