1 |
1
자동 음소분할기를 이용한 음소분할에서 음소경계 오류를 줄이기 위한 음소분할 방법에 있어서, 통계적 방법에 의한 음소의 경계 오류를 보정하는 제 1 단계와; 제 1 단계 수행 후 통계적인 방법으로 음소 경계 탐색구간을 설정하는 제 2 단계와; 제 2 단계 수행 후 음운 환경에 강인한 특징 파라미터를 적용하는 제 3 단계와; 제 3 단계 수행 후 신경회로망을 이용한 후처리를 수행하는 제 4 단계를 포함하는 것을 특징으로 하는 음소분할 후처리 방법
|
2 |
2
제 1 항에 있어서, 제 1 단계는 수동 음소 분할 데이터베이스로부터 통계정보인 음소경계 오류의 평균값과 표준편차를 추출하는 제 1 부단계와; 상기 제 1 부단계 수행 후 신경회로망을 훈련하기 위한 특징 파라미터를 추출하는 제 2 부단계와; 제 2 부단계 수행 후 추출한 특징 파라미터 Ⅰ, Ⅱ에 따라 신경회로망을 각각 훈련하는 제 3 부단계로 이루어진 것을 특징으로 하는 음소분할 후처리 방법
|
3 |
3
제 2 항에 있어서, 상기 제 3 부단계는 신경회로망 출력값이 임계치에 도달할 때 훈련을 끝내고, 그렇지 않을 경우반복해서 훈련을 하는 것을 특징으로 하는 음소분할 후처리 방법
|
4 |
4
제 1 항에 있어서, 상기 제 2 단계는 훈련 계속 여부를 판단한 후 훈련을 계속하지 않을 경우 다시 상기 특징 파라미터에 따라 신경회로망 훈련을 수행하는 제 1 부단계와; 상기 판단 후 훈련을 계속 할 경우 신경회로망의 훈련 파라미터인 가중 Ⅰ, Ⅱ 값을 추출하여 하드디스크에 저장한 후 훈련을 끝마치는 제 2 부단계로 이루어진 것을 특징으로 하는 음소분할 후처리 방법
|
5 |
5
제 1 항에 있어서, 상기 제 3 단계는 후처리 훈련 과정에서 추출한 통계정보를 이용하여 오류를 1차적으로 보정하는 제 1 부단계와; 제 1 부단계 수행 후 자동음소 분할 데이터베이스를 입력받아 신경회로망을 훈련하기 위해 수동분할된 음성데이터로부터 다수 형태의 파라미터를 추출하는 제 2 부단계와; 제 2 부단계 수행 후 시간영역에서 추출한 영교차율, 에너지와 주파수 영역에서 나타나는 스펙트럼 정보인 대역별 에너지 정보 등 9차를 특징 파라미터 Feature Set Ⅰ로하고, 사람의 청각 특성을 모델링한 지각 선형 예상(PLP) 계수 13차를 특징 파라미터 Feature Set Ⅱ로 하여 음성 특징을 추출하여 음운환경을 선택하는 제 3 부단계와; 제 3 부단계 수행 후 각 음운환경별로 특징 파라미터 가중값을 적용하여 후처리를 수행하는 제 4 부단계로 이루어진 것을 특징으로 하는 음소분할 후처리 방법
|
6 |
6
제 5 항에 있어서, 상기 제 1 부단계는 자동분할된 음소 위치와 오류의 평균치를 이용하여 보정된 음소위치를 결정하는 것을 특징으로 하는 음소분할 후처리 방법
|
7 |
7
제 1 항에 있어서, 상기 제 4 단계는 탐색구간 결정 후 그 구간내에서 임계값 이상의 신경회로망 출력값이 존재하면 임계값 중 최대값을 가지는 위치를 후처리된 음소 경계로 선택하는 제 1 부단계와; 상기 탐색구간 내에 임계값 이상의 신경회로망 출력값이 존재하는지 판단한 후 존재하지 않는 경우 자동 음소분할 결과를 그대로 이용하는 제 2 부단계와; 상기 탐색구간 내에 임계값 이상의 신경회로망 출력값이 존재하면 후처리 부분에서 통계적 정보를 이용한 보정을 수행한 후 후처리를 끝마치는 제 3 부단계로 이루어진 것을 특징으로 하는 음소분할 후처리 방법
|