1
문장 단위로 음성 데이터를 입력 받아 녹음하는 단계; 상기 음성 데이터에 대하여 음소 분할과 억양 추출을 수행하는 단계; 상기 음성 데이터로부터 음소의 지속시간과 그 음소에 해당하는 억양값을 추출하여 각 음소별 평균 지속시간과 평균 억양을 추출하는 단계; 상기 음소 분할의 정보와 상기 추출된 억양값을 이용하여 복수의 운율 특징을 추출하는 단계; 상기 추출된 복수의 운율 특징을 최종 평균값으로 정규화시키는 단계; 상기 음성 데이터의 일부로부터 수동으로 끊어읽기 강도를 레이블링한 결과를 마련하는 단계; 및 상기 정규화된 복수의 운율 특징과 상기 수동으로 끊어읽기 강도를 레이블링한 결과를 사용하여 판별 및 회귀 트리(CART : Classification and Regression Tree)의 훈련을 실행함으로써 이진 결정 트리를 생성하고, 상기 이진 결정 트리에 의해 끊어읽기 강도 자동 레이블링 규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 판별 및 회귀 트리를 이용한 끊어읽기 강도 자동 레이블링 방법
|