요약 |
본 발명은 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치에 관한 것으로서, 보다 구체적으로는, 사용자 맞춤형 음성 보정 장치가, (1) 원시 음성 데이터를 입력받는 단계; (2) 상기 입력된 원시 음성 데이터로부터 피치, 특성 파형(CW), 파워 및 선스펙트럼 주파수(LSF)를 포함한 음성 파라미터들을 추출하는 단계; (3) 상기 추출된 음성 파라미터들에 대해, 미리 설정된 복수의 특이 음성이 갖는 제1 특징들을 미리 설정된 정상 음성이 갖는 제2 특징들로 변경하는 단계; 및 (4) 상기 변경된 제2 특징을 갖는 음성 파라미터들에 기초하여, 보정된 음성 데이터를 합성하는 단계를 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치에 따르면, 사용자 맞춤형 음성 보정 장치가, 원시 음성 데이터를 입력받고, 입력된 원시 음성 데이터로부터 피치, 특성 파형(CW), 파워 및 선스펙트럼 주파수(LSF)를 포함한 음성 파라미터들을 추출하며, 추출된 음성 파라미터들에 대해, 미리 설정된 복수의 특이 음성이 갖는 제1 특징들을 미리 설정된 정상 음성이 갖는 제2 특징들로 변경하고, 변경된 제2 특징을 갖는 음성 파라미터들에 기초하여, 보정된 음성 데이터를 합성함으로써, 쉰(hoarse) 음성, 거친(rough) 음성, 숨찬(breathy) 음성 및 비음(nasal) 음성과 같은 특이 목소리를 분석 및 개선할 수 있고, 음색을 차가운 느낌 또는 따뜻한 느낌으로 변경할 수 있다. 또한, 음성 통화를 통해 식별되기 어려운 음성이나 화자가 갖고 있는 불만족스러운 음성을, 또렷하거나 원하는 음색의 음성으로 변경할 수 있게 하고, 화자가 갖는 발성 기관의 신체적 문제를 보조할 수 있으며, 사용자가 어필하고 싶은 음색의 음성을 생성하게 함으로써, 사용자의 욕구에 맞추어 다양하게 음성을 보정할 수 있다.
|