1 |
1
음성 신호에서 프레임 음성 특징 벡터를 추출하는 단계;상기 프레임 음성 특징 벡터와 프레임 기반 확률 모델을 이용하여, 상기 음성 신호의 프레임 구간에 대한 음성 인식을 진행하는 단계;상기 음성 신호를 상기 프레임 구간보다 시간상 길이가 긴 세그먼트 구간으로 분할하는 단계;상기 세그먼트 구간의 분할 경계 구간을 중심으로 세그먼트 음성 특징 벡터를 추출하는 단계;상기 세그먼트 음성 특징 벡터와 세그먼트 기반 확률 모델을 이용하여 음성 인식을 진행하는 단계; 및상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 결합하는 단계를 포함하는 것을 특징으로 하는 음성 인식 방법
|
2 |
2
청구항 1에 있어서, 상기 음성 신호를 상기 세그먼트 구간으로 분할하는 단계는, 인접하는 제 1 프레임 음성 특징 벡터와 제 2 프레임 음성 특징 벡터 사이의 거리 척도를 계산하여 기 정해진 값보다 큰 값을 갖는 경우, 상기 제 1 프레임 음성 특징 벡터와 상기 제 2 프레임 음성 특징 벡터의 사이를 세그먼트의 분할 지점으로 하여 상기 음성 신호를 상기 세그먼트 구간으로 분할하는 것을 특징으로 하는 음성 인식 방법
|
3 |
3
청구항 2에 있어서,상기 거리 척도는 시간에 따른 상기 음성 신호의 변화 값인 것을 특징으로 하는 음성 인식 방법
|
4 |
4
청구항 1에 있어서,상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 동기화하는 단계를 더 포함하는 것을 특징으로 하는 음성 인식 방법
|
5 |
5
청구항 4에 있어서, 상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과를 동기화하는 단계에서, 상기 프레임 구간의 음성 인식의 결과와 상기 세그먼트 구간의 음성 인식 결과의 음소 분할의 동기화를 위하여,상기 프레임 기반 확률 모델과 상기 세그먼트 기반 확률 모델의 결합 부분에 DBN(Dynamic Bayesian Network)에 기반한 전환선형동적모델(SLDM; Switching Linear Dynamic Model)을 적용하는 것을 특징으로 하는 음성 인식 방법
|
6 |
6
청구항 1에 있어서,상기 세그먼트 음성 특징 벡터를 추출하는 단계는,상기 세그먼트 음성 특징 벡터를상기 음성 신호의 상기 세그먼트 구간에 대한 주요소해석(PCA; Principle Component Analysis) 및 궤적 정보(Trajectory Information) 특징 추출 기법을 이용하여 추출하는 것을 특징으로 하는 음성 인식 방법
|
7 |
7
청구항 1에 있어서,상기 세그먼트 기반 확률 모델은 상기 세그먼트 음성 특징 벡터에 기반한 가우시안 모델인 것을 특징으로 하는 음성 인식 방법
|
8 |
8
청구항 1에 있어서, 상기 프레임 기반 확률 모델은 은닉 마르코프 모델(HMM; Hidden Markov Model)인 것을 특징으로 하는 음성 인식 방법
|
9 |
9
음성 신호에서 프레임 음성 특징 벡터를 추출하고, 상기 프레임 음성 특징 벡터와 프레임 기반 확률 모델을 이용하여, 상기 음성 신호의 프레임 구간에 대한 음성 인식을 진행하는 프레임 기반 음성 인식부;상기 음성 신호를 상기 프레임 구간보다 시간상 길이가 긴 세그먼트 구간으로 분할하는 세그먼트 분할부;상기 세그먼트 구간의 분할 경계 부분을 중심으로 세그먼트 음성 특징 벡터를 추출하는 세그먼트 특징 추출부;상기 세그먼트 음성 특징 벡터와 세그먼트 기반 확률 모델을 이용하여 음성 인식을 진행하는 세그먼트 음성 인식 진행부; 및상기 프레임 기반 음성 인식부에 의한 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 결합하는 결합 동기화부를 포함하는 것을 특징으로 하는 음성 인식 장치
|
10 |
10
청구항 9에 있어서, 상기 세그먼트 분할부는인접하는 제 1 프레임 음성 특징 벡터와 제 2 프레임 음성 특징 벡터 사이의 거리 척도를 계산하여 기 정해진 값보다 큰 값을 갖는 경우, 상기 제 1 프레임 음성 특징 벡터와 상기 제 2 프레임 음성 특징 벡터의 사이를 세그먼트의 분할 지점으로 하여 상기 음성 신호를 세그먼트 구간으로 분할하는 것을 특징으로 하는 음성 인식 장치
|
11 |
11
청구항 10에 있어서, 상기 거리 척도는 시간에 따른 상기 음성 신호의 변화 값인 것을 특징으로 하는 음성 인식 장치
|
12 |
12
청구항 9에 있어서,상기 결합 동기화부는상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 동기화하는 것을 특징으로 하는 음성 인식 장치
|
13 |
13
청구항 12에 있어서,상기 결합 동기화부는상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과를 동기화하기 위하여,상기 프레임 기반 음성 인식부의 음성 인식 결과와, 상기 세그먼트 음성 인식 진행부의 음성 인식 결과의 결합 부분에 DBN(Dynamic Bayesian Network)에 기반한 전환선형동적모델(SLDM; Switching Linear Dynamic Model)을 적용하는 것을 특징으로 하는 음성 인식 장치
|
14 |
14
청구항 9에 있어서,상기 세그먼트 특징 추출부는,상기 세그먼트 음성 특징 벡터를상기 음성 신호의 상기 세그먼트 구간에 대한 주요소해석(PCA; Principle Component Analysis) 및 궤적 정보(Trajectory Information) 특징 추출 기법을 이용하여 추출하는 것을 특징으로 하는 음성 인식 장치
|
15 |
15
청구항 9에 있어서, 상기 세그먼트 기반 확률 모델은 상기 세그먼트 음성 특징 벡터에 기반한 가우시안 모델인 것을 특징으로 하는 음성 인식 장치
|
16 |
16
청구항 9에 있어서, 상기 프레임 기반 확률 모델은 은닉 마르코프 모델(HMM; Hidden Markov Model)인 것을 특징으로 하는 음성 인식 장치
|