1 |
1
음성을 이용하여 콘텐츠를 제작하는 장치에 있어서,사용자의 발화된 음성을 인식하여 음성 신호로 변환하는 음성 신호 변환부,상기 음성 신호에 대응하는 음향 샘플을 검색하는 샘플 검색부 및상기 발화된 음성의 발성 패턴에 기초하여, 상기 음성 신호 및 상기 음향 샘플에 대하여 음절 분리 가능 여부를 확인하고 음절 분리가 가능한 경우, 상기 각 음절에 대하여, 상기 음성 신호의 시간에 대한 길이 및 주파수 영역에서의 에너지 분포를 기준으로, 상기 음향 샘플의 시간에 대한 길이 및 주파수 영역에서의 에너지 분포를 각각 변환하고, 상기 음성 신호 및 상기 음향 샘플 중 어느 하나에 대하여 음절 분리가 불가능한 경우, 상기 음성 신호의 시간에 대한 전체 길이 및 주파수 영역에서의 전체 에너지 분포를 기준으로, 상기 음향 샘플의 시간에 대한 전체 길이 및 주파수 영역에서의 전체 에너지 분포를 각각 변환하는 음향 신호 변환부를 포함하되,상기 발화된 음성의 발성 패턴은 상기 발화된 음성의 시간에 대한 길이 및 주파수 영역에서의 에너지 분포를 포함하는 것인, 음성을 이용한 콘텐츠 제작 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서상기 음향 신호 변환부는 상기 각 음절 별로 상기 주파수 영역에서의 에너지 분포에 대한 피크를 검색하고, 상기 검색된 피크 사이에서 최소의 에너지 값을 가지는 위치를 상기 음절 간의 경계로 정하는, 음성을 이용한 콘텐츠 제작 장치
|
5 |
5
제 1 항에 있어서,상기 음향 신호 변환부는 상기 주파수 영역에서의 에너지 분포에서 미리 정해진 임계값 이하를 가지는 위치를 상기 음절 간의 경계로 정하는, 음성을 이용한 콘텐츠 제작 장치
|
6 |
6
제 1 항에 있어서,상기 음향 신호 변환부는 Synchronized Overlap and Add(SOLA) 알고리즘을 이용하여, 상기 음성 신호의 시간에 대한 길이를 기준으로 상기 음향 샘플의 시간에 대한 길이를 변환하는, 음성을 이용한 콘텐츠 제작 장치
|
7 |
7
제 1 항에 있어서,상기 음향 신호 변환부는 상기 각 음절에 대하여, 상기 음성 신호 및 상기 음향 샘플의 주파수 영역에서의 에너지 분포 비율을 계산하고, 상기 계산 결과에 기초하여 상기 음성 신호의 주파수 영역에서의 에너지 분포를 기준으로, 상기 음향 샘플의 주파수 영역에서의 에너지 분포를 변환하는, 음성을 이용한 콘텐츠 제작 장치
|
8 |
8
제 1 항에 있어서,상기 음성 신호를 분석하여 상기 주파수 영역에서의 에너지 분포에 대한 정보 및 상기 음성 신호의 음을 텍스트로 표현한 정보 중 하나 이상을 포함하는 음성 신호 분석 정보를 추출하는 음성 신호 분석부를 더 포함하는, 음성을 이용한 콘텐츠 제작 장치
|
9 |
9
제 8 항에 있어서,상기 샘플 검색부는 상기 주파수 영역에서의 에너지 분포에 대한 정보 및 상기 음성 신호의 음을 텍스트로 표현한 정보 중 적어도 하나를 만족하는 상기 음향 샘플을 검색하는, 음성을 이용한 콘텐츠 제작 장치
|
10 |
10
콘텐츠 제작 장치가, 콘텐츠를 제작하는 방법에 있어서,(a) 사용자의 발화된 의성어를 인식하여 음성 신호로 변환하는 단계,(b) 상기 음성 신호에 대응하는 음향 샘플을 추출하는 단계,(c) 음성 신호 및 상기 음향 샘플의 음절 분리 가능 여부를 판단하는 단계,(d) 상기 판단 결과, 음절 분리가 가능한 경우, 상기 각 음절에 대하여, 상기 음성 신호의 시간에 대한 길이 및 주파수 영역에서의 에너지 분포를 기준으로, 상기 음향 샘플의 시간에 대한 길이 및 주파수 영역에서의 에너지 분포를 각각 변환하는 단계 및 (e) 상기 판단 결과, 상기 음성 신호 및 상기 음향 샘플 중 어느 하나에 대하여 음절 분리가 불가능한 경우, 상기 음성 신호의 시간에 대한 전체 길이 및 주파수 영역에서의 전체 에너지 분포를 기준으로, 상기 음향 샘플의 시간에 대한 전체 길이 및 주파수 영역에서의 전체 에너지 분포를 각각 변환하는 단계를 포함하는 음성을 이용한 콘텐츠 제작 방법
|
11 |
11
삭제
|
12 |
12
제 10 항에 있어서,상기 (c) 단계는 상기 각 음절 별로 상기 주파수 영역에서의 에너지 분포에 대한 피크를 검색하고, 상기 검색된 피크 사이에서 최소의 에너지 값을 가지는 위치를 상기 음절 간의 경계로 정하여 상기 음절 분리가 가능하다고 판단하는, 음성을 이용한 콘텐츠 제작 방법
|
13 |
13
제 10 항에 있어서,상기 (c) 단계는 상기 주파수 영역에서의 에너지 분포에서 미리 정해진 임계값 이하를 가지는 위치를 상기 음절 간의 경계로 정하여 상기 음절 분리가 가능하다고 판단하는, 음성을 이용한 콘텐츠 제작 방법
|
14 |
14
제 10 항에 있어서,상기 (d) 단계는 Synchronized Overlap and Add(SOLA) 알고리즘을 이용하여, 상기 음성 신호의 시간에 대한 길이를 기준으로 상기 음향 샘플의 시간에 대한 길이를 변환하는, 음성을 이용한 콘텐츠 제작 방법
|
15 |
15
제 10 항에 있어서,상기 (d) 단계는 상기 각 음절에 대하여, 상기 음성 신호 및 상기 음향 샘플의 주파수 영역에서의 에너지 분포 비율을 계산하고, 상기 계산 결과에 기초하여 상기 음성 신호의 주파수 영역에서의 에너지 분포를 기준으로, 상기 음향 샘플의 주파수 영역에서의 에너지 분포를 변환하는, 음성을 이용한 콘텐츠 제작 방법
|
16 |
16
제 10 항에 있어서,(f) 상기 변환된 음향 샘플을 콘텐츠에 삽입하는 단계를 더 포함하는, 음성을 이용한 콘텐츠 제작 방법
|