1 |
1
디지털 음성신호를 일정한 시간 간격의 프레임 단위로 분할하고, 프레임마다 음향 특징 파라메터를 추출하는 특징추출기;상기 특징 파라미터들의 프레임별 집합인 특징 벡터로부터 클래스 가중치 정보를 매 프레임마다 추출하는 클래스정보 추출부와, 여러 프레임들로 구성된 입력 시험 특징 파라메터들로부터 각 클래스마다 시험 누적분포함수를 구하는 클래스별 시험 누적분포함수 추정부와, 시험 특징 파라메터를 입력으로 받아, 클래스별 훈련 누적분포함수 및 상기 클래스별 시험 누적분포함수 추정부에서 구한 클래스별 시험 누적분포함수를 이용하여, 각 클래스별로 히스토그램 등화를 수행하는 클래스별 히스토그램 등화부와, 상기 클래스별 히스토그램 등화부로부터 입력되는 등화 결과와 상기 클래스정보 추출부로부터 입력되는 개별 클래스의 가중치를 곱하여, 각 클래스별 특징 보상성분을 구하는 클래스별 보상성분 추출부 및, 전체 클래스별 보상성분을 가산하여 보상된 특징 파라메터를 생성하는 보상성분 통합부를 포함하는 특징보상기 및;보상된 특징 파라메터로부터 음성인식을 수행하는 음성인식기를 구비하는 것을 특징으로 하는 음성인식 시스템
|
2 |
2
삭제
|
3 |
3
제1항에 있어서, 상기 특징보상기는 음향 특징 파라메터로부터 잡음이 일차로 제거된 특징 파라미터를 추출하는 일차 특징보상부를 더 구비하는 것을 특징으로 하는 음성인식 시스템
|
4 |
4
제1항에 있어서, 상기 특징보상기의 클래스정보 추출부에 있어서, 클래스 가중치 정보[w(n,j)]는 각 프레임에서 추출된 특징 벡터가 특정 클래스에 속할 사후 확률로서 수학식 w(n,j)=p(n,j)와 같이 계산되고, 상기의 수학식에서 p(n,j)는 n번째 프레임의 특징 벡터가 j번째 클래스에 속할 확률을 의미하고, J는 전체 클래스들의 수를 의미하는 것을 특징으로 하는 음성인식 시스템
|
5 |
5
제1항에 있어서, 상기 특징보상기의 상기 클래스별 시험 누적분포함수 추정부에 있어서,시험 특징 파라메터[y(n,k)]에 대한 j번째 클래스, k번째 계수의 시험 누적분포함수 값인 CY(j,k)[y(n,k)]는 수학식 와 같이 계산되고, 상기 수학식에서, BY[j,k,n]는 j번째 클래스, k번째 계수의 시험 히스토그램에서 입력 특징 파라메터 y(n,k)가 속한 빈(bin)의 인덱스를 의미하고, PY(j,k)(b)는 j번째 클래스, k번째 계수의 시험 히스토그램에서 b번째 빈의 확률값을 나타내는 확률밀도함수인 것을 특징으로 하는 음성인식 시스템
|
6 |
6
제1항에 있어서, 상기 특징보상기의 상기 보상성분 통합부에서 생성되는 보상된 특징 파라메터 는 수학식 와 같이 계산되는 것을 특징으로 하는 음성인식 시스템
|
7 |
7
제1항에 있어서, 아날로그 음성신호를 디지털 음성신호로 변환하는 음성입력기를 더 구비하는 것을 특징으로 하는 음성인식 시스템
|
8 |
8
(a) 디지털 음성신호를 일정 시간 간격의 프레임 단위로 분할하는 단계;(b) 프레임마다 음향 특징 파라메터를 추출하는 단계;(c) 특징 파라미터들의 프레임별 집합인 특징 벡터로부터 클래스 가중치 정보를 매 프레임마다 추출하는 단계;(d) 여러 프레임들로 구성된 시험 특징 파라메터들로부터 각 클래스마다 시험 누적분포함수를 구하는 단계;(e) 클래스별 훈련 누적분포함수 및 클래스별 시험 누적분포함수를 이용하여, 시험 특징 파라메터에 대해 각 클래스별로 히스토그램 등화를 수행하는 단계;(f) 상기 히스토그램 등화 결과에 개별 클래스의 가중치를 곱하여, 각 클래스별 특징 보상성분을 구하는 단계;(g) 각 클래스별 특징 보상성분을 가산하여 보상된 특징 파라메터를 생성하는 단계;(h) 전체 클래스별 특징 보상 성분을 가산하여 음향 불일치가 보상된 특징 파라메터를 구하는 단계 및;(g) 보상된 특징 파라메터로부터 음성인식을 수행하는 단계를 포함하는 것을 특징으로 하는 음성인식 방법
|
9 |
9
삭제
|
10 |
10
제8항에 있어서, 상기 (c) 단계 전에, 음향 특징 파라메터로부터 일차로 잡음을 제거하는 단계를 더 구비하는 것을 특징으로 하는 음성인식 방법
|
11 |
11
제8항에 있어서, 상기 (c) 단계에 있어서, 클래스 가중치 정보[w(n,j)]는 각 프레임에서 추출된 특징 벡터가 특정 클래스에 속할 사후 확률로서 수학식 w(n,j)=p(n,j)와 같이 계산되고, 상기의 수학식에서 p(n,j)는 n번째 프레임의 특징 벡터가 j번째 클래스에 속할 확률을 의미하고, J는 전체 클래스들의 수를 의미하는 것을 특징으로 하는 음성인식 방법
|
12 |
12
제8항에 있어서, 상기 (d) 단계에 있어서,시험 특징 파라메터[y(n,k)]에 대한 j번째 클래스, k번째 계수의 시험 누적분포함수 값인 CY(j,k)[y(n,k)]는 수학식 와 같이 계산되고, 상기 수학식에서, BY[j,k,n]는 j번째 클래스, k번째 계수의 시험 히스토그램에서 입력 특징 파라메터 y(n,k)가 속한 빈(bin)의 인덱스를 의미하고, PY(j,k)(b)는 j번째 클래스, k번째 계수의 시험 히스토그램에서 b번째 빈의 확률값을 나타내는 확률밀도함수인 것을 특징으로 하는 음성인식 방법
|
13 |
13
제8항에 있어서, 상기 (g) 단계에 있어서, 상기 보상된 특징 파라메터 는, 수학식 와 같이 계산되는 것을 특징으로 하는 음성인식 방법
|
14 |
14
제8항에 있어서, 상기 (a) 단계 전에, 아날로그 음성신호를 디지털 신호로 변환하는 단계를 더 구비하는 것을 특징으로 하는 음성인식 방법
|