1 |
1
실시간 비디오 음성 더빙 장치에 있어서,동영상의 음향을 입력받아 상기 입력된 음향을 효과음, 배경음, 화자 음성으로 각각 분리하고 상기 화자 음성을 분석하여 음성의 특징을 추출하기 위한 음성 분석 모듈;상기 동영상의 자막 데이터를 입력받아 상기 입력된 자막 데이터를 분석하여 타이밍 정보에 따라 자막 텍스트 출력하기 위한 자막 분석 모듈;상기 자막 분석 모듈로부터 전달된 자막 텍스트를 음성으로 변환하고, 상기 변환된 음성에 상기 음성 분석 모듈로부터 입력된 음성의 특징을 반영하여 합성 음성을 출력하기 위한 음성 합성 모듈; 및상기 음성 합성 모듈로부터 합성 음성을 입력받고, 상기 음성 분석 모듈로부터 화자의 음성을 입력받아 사용자의 선택 신호에 따라 화자의 음성 및/또는 합성 음성을 선택하여 출력하기 위한 음성 출력 모듈을 포함하는 실시간 비디오 음성 더빙 장치
|
2 |
2
제 1 항에 있어서,상기 음성 분석 모듈은,상기 동영상 콘텐츠의 음향 신호를 입력받기 위한 음향 입력 수단;상기 음향 입력 수단으로부터 전달된 음향을 배경음, 효과음, 화자 음성으로 각각 분리하기 위한 음향 분리 수단;상기 음향 분리 수단으로부터 입력된 배경음, 효과음을 출력하기 위한 기타 채널 수단;상기 음향 분리 수단으로부터 입력된 화자 음성을 출력하기 위한 음성 채널 수단; 및상기 음성 채널 수단으로부터 입력된 화자 음성을 분석하여 음성의 특징을 추출하기 위한 특징 추출 수단을 포함하는 실시간 비디오 음성 더빙 장치
|
3 |
3
제 2 항에 있어서,상기 자막 분석 모듈은,상기 동영상 콘텐츠의 자막 데이터를 입력받기 위한 자막 입력 수단; 및상기 자막 입력 수단을 통해 입력된 자막 데이터를 파서를 이용해 파싱한 후, 자막 텍스트를 추출하며, 자막 데이터의 헤더 정보로부터 타이밍 정보를 추출한 후, 상기 추출된 타이밍 정보에 따라 자막 텍스트를 출력하기 위한 자막 디코딩 수단을 포함하는 실시간 비디오 음성 더빙 장치
|
4 |
4
제 3 항에 있어서,상기 음성 합성 모듈은,텍스트에 따른 음성을 저장하고 있는 음성 데이터베이스; 및상기 음성 데이터베이스를 이용해 상기 자막 디코딩 수단으로부터 입력되는 자막 텍스트를 음성으로 변환하고, 상기 변환된 음성에 상기 특징 추출 수단으로부터 입력된 음성의 특징을 반영하여 합성 음성을 출력하기 위한 음성 합성 수단을 포함하는 실시간 비디오 음성 더빙 장치
|
5 |
5
제 4 항에 있어서,상기 음성 출력 모듈은,상기 음성 채널 수단으로부터 화자의 음성을 입력받고, 상기 음성 합성 수단으로부터 합성 음성을 입력받아, 상기 화자의 음성을 이용해 상기 합성 음성의 동기를 보정한 후 사용자의 선택에 따라 합성 음성을 스피커를 통해 출력하는 음성 데이터 선택 수단을 포함하는 것을 특징으로 하는 실시간 비디오 음성 더빙 장치
|
6 |
6
제 5 항에 있어서,상기 기타 채널 수단은,상기 음성 데이터 선택 수단으로 효과음과 배경음을 출력하고, 상기 음성 데이터 선택 수단은 상기 합성 음성과 효과음과 배경음을 함께 상기 스피커를 통해 출력하는 것을 특징으로 하는 실시간 비디오 음성 더빙 장치
|
7 |
7
제 5 항에 있어서,상기 기타 채널 수단은,효과음과 배경음을 합성 음성의 출력 타이밍에 동기시켜 상기 스피커를 통해 출력하는 것을 특징으로 하는 비디오 음성 더빙 장치
|
8 |
8
실시간 비디오 음성 더빙 방법에 있어서,동영상의 자막 데이터를 파싱하여 자막 텍스트를 추출하고, 헤더 정보에 포함된 타이밍 정보에 따라 상기 자막 텍스트를 출력하는 단계;동영상의 음향을 배경음, 효과음과 화자 음성으로 각각 분리한 후, 상기 화자 음성을 분석하여 음성의 특징으로 추출하는 단계;상기 추출한 자막 텍스트를 음성으로 변환하고, 상기 추출한 음성의 특징을 상기 변환된 음성에 반영하여 합성 음성을 출력하는 단계; 및화자의 음성을 이용해 상기 합성 음성의 동기를 보정한 후, 배경음, 효과음과 함께 스피커를 통해 출력하는 출력 단계를 포함하는 실시간 비디오 음성 더빙 방법
|
9 |
9
제 8 항에 있어서,상기 출력 단계는,사용자의 조작에 의해 입력된 선택 신호에 따라 화자의 음성 또는 합성 음성을 선택하여 출력하는 것을 특징으로 하는 실시간 비디오 음성 더빙 방법
|