1 |
1
발화 제어 장치를 통한 발화 제어 방법에 있어서,발화 문장에 상응하는 음성 데이터의 재생 시간을 기준으로 상기 발화 문장을 구성하는 복수개의 어절들이 각각 상기 음성 데이터 중 어느 구간에 위치하는지 분석하는 단계;발화 시작, 일시 정지, 발화 중단 및 발화 재개 중 적어도 하나의 제어 명령을 기반으로 상기 음성 데이터의 출력을 제어하는 단계;상기 일시 정지가 입력된 경우, 상기 음성 데이터의 정지 시점과 상기 복수개의 어절들 각각에 대한 구간 정보를 고려하여 상기 복수개의 어절들 중 어느 하나의 시작 어절을 결정하는 단계;상기 발화 재개가 입력된 경우, 복수개의 부가 어절들과 상기 복수개의 부가 어절들 각각에 매칭된 음성 데이터를 포함하는 부가 어절 사전을 기반으로 부가 어절을 상기 시작 어절의 이전에 추가하는 단계; 및상기 부가 어절을 포함한 상기 시작 어절부터 상기 음성 데이터를 출력하는 단계; 를 포함하되,상기 분석하는 단계는,상기 음성 데이터의 재생 시작 시간부터 재생 종료 시간에 상응하는 재생 구간 상에 상기 복수개의 어절들을 동적정합(Dynamic Time Warping, DTW) 및 은닉 마르코프 모델(Hidden Markov Model, HMM) 중 적어도 하나 이상의 모델을 포함한 강제 정렬(Forced Alignment) 기법을 통하여 시간 순서대로 정렬하고, 상기 정렬된 복수개의 어절들 각각에 대한 시작 시간과 종료 시간을 포함하는 음성 문장 정렬 정보를 생성하는 것을 특징으로 하는 발화 제어 방법
|
2 |
2
삭제
|
3 |
3
청구항 1에 있어서,상기 결정하는 단계는상기 음성 문장 정렬 정보를 참조하여 상기 정지 시점이 상기 복수개의 어절들 중 어느 하나의 어절에 대한 시작 시간과 종료 시간의 사이에 위치하는 경우, 상기 어느 하나의 어절을 시작 어절로 결정하는 것을 특징으로 하는 발화 제어 방법
|
4 |
4
청구항 1에 있어서,상기 결정하는 단계는상기 음성 문장 정렬 정보를 참조하여 상기 정지 시점이 상기 복수개의 어절들 중 순차적인 어느 두 개의 어절들 사이에 위치하는 경우, 상기 어느 두 개의 어절들 중 상기 정지 시점의 이후에 위치하는 어절을 상기 시작 어절로 결정하는 것을 특징으로 하는 발화 제어 방법
|
5 |
5
청구항 1에 있어서,상기 결정하는 단계는상기 발화 문장이 적어도 두 개의 문장들로 구성된 경우, 상기 적어도 두 개의 문장들 중 상기 정지 시점을 포함하는 어느 하나의 문장을 구성하는 첫 번째 어절을 상기 시작 어절로 결정하는 것을 특징으로 하는 발화 제어 방법
|
6 |
6
삭제
|
7 |
7
삭제
|
8 |
8
청구항 1에 있어서,상기 발화 제어 방법은상기 발화 중단이 입력된 경우에 상기 발화 문장과 상기 음성 데이터를 삭제하고, 새로운 발화 문장이 입력될 때까지 대기하는 단계를 더 포함하는 것을 특징으로 하는 발화 제어 방법
|
9 |
9
청구항 1에 있어서,상기 제어하는 단계는상기 음성 데이터가 출력되는 동안에 상기 재생 시간을 지속적으로 모니터링하는 것을 특징으로 하는 발화 제어 방법
|
10 |
10
발화 문장에 상응하는 음성 데이터의 재생 시간을 기준으로 상기 발화 문장을 구성하는 복수개의 어절들이 각각 상기 음성 데이터 중 어느 구간에 위치하는지 분석하되, 상기 음성 데이터의 재생 시작 시간부터 재생 종료 시간에 상응하는 재생 구간 상에 상기 복수개의 어절들을 동적정합(Dynamic Time Warping, DTW) 및 은닉 마르코프 모델(Hidden Markov Model, HMM) 중 적어도 하나 이상의 모델을 포함한 강제 정렬(Forced Alignment) 기법을 통하여 시간 순서대로 정렬하고, 상기 정렬된 복수개의 어절들 각각에 대한 시작 시간과 종료 시간을 포함하는 음성 문장 정렬 정보를 생성하고, 발화 시작, 일시 정지, 발화 중단 및 발화 재개 중 적어도 하나의 제어 명령을 기반으로 상기 음성 데이터의 출력을 제어하고, 상기 일시 정지가 입력된 경우에는 상기 음성 데이터의 정지 시점과 상기 복수개의 어절들 각각에 대한 구간 정보를 고려하여 상기 복수개의 어절들 중 어느 하나의 시작 어절을 결정하고, 상기 발화 재개가 입력된 경우, 복수개의 부가 어절들과 상기 복수개의 부가 어절들 각각에 매칭된 음성 데이터를 포함하는 부가 어절 사전을 기반으로 부가 어절을 상기 시작 어절의 이전에 추가하고, 상기 부가 어절을 포함한 상기 시작 어절부터 상기 음성 데이터를 출력하는 프로세서; 및상기 발화 문장, 상기 음성 데이터 및 상기 복수개의 어절들 각각에 대한 구간 정보 중 적어도 하나를 저장하는 메모리를 포함하는 것을 특징으로 하는 발화 제어 장치
|