1 |
1
멜-주파수 켑스트럼 계수(MFCC) 특징을 추출하여 시간에 따른 프레임열을 출력하는 특징추출부; 상기 출력된 멜-주파수 켑스트럼 계수(MFCC) 특징열의 평균값을 계산하는 특징 파라미터 평균계산부; 채널변이를 줄인 음성 데이터베이스로부터 코드북을 구성한 후, 채널왜곡된 입력음성의 멜-주파수 켑스트럼 계수(MFCC)값이 들어오면 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)값과 상기 코드북 중심값과의 거리를 구해 프레임별 채널변이를 추정하는 프레임별 채널변이 추정부; 및 상기 특징 파라미터 평균계산부에서 얻어진 채널변이와 상기 프레임별 채널변이 추정부에서 얻어진 시간별 채널변이의 평균값을 스무싱(smoothing)한 후 스무싱된 평균값을 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)에서 빼어 채널정규화된 멜-주파수 켑스트럼 계수(MFCC) 특징열을 출력하는 스무싱 기반 채널정규화부를 포함하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
|
2 |
2
제 1 항에 있어서, 상기 코드북은 피시에이(PCA:Principle Component Analysis) 기반으로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
|
3 |
3
제 2 항에 있어서, 상기 PCA 기반 코드북은 중심값 개수를 8∼10개로 설계하는 것을 특징으로 하는강인한 음성인식을 위한 채널 정규화 장치
|
4 |
4
제 1 항에 있어서, 상기 채널 정규화 장치는 채널정규화의 실시간처리를 위해 이전 발화로부터 얻어진 채널추정값으로 현재 입력발화를 정규화하고, 현재발화의 추정값은 다음 발화를 위해 과거값과 함께 지속적으로 갱신하는 채널변이 갱신부를 더 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
|
5 |
5
제 4 항에 있어서, 상기 실시간 채널정규화장치는 온라인 음성인식시스템에 적용되는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
|
6 |
6
제 1 항에 있어서, 상기 특징추출부는 음성신호의 주파수 스펙트럼 정보를 추출하는 스펙트럼 분석부와, 상기 스펙트럼 분석부에 의해 구해진 스펙트럼으로부터 간략화된 스펙트럼의 포락선을 구하는 필터뱅크부와, 상기 간략화된 스펙트럼의 크기를 로그함수를 이용하여 함축시키는 로그 압축부와, 상기 로그 압축부의 출력을 이산 코사인 변환(DCT)하여 켑스트럼 계수를 구하는 이산 코사인 변환부로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 장치
|
7 |
7
각 시간별 채널변이를 추정하기 위하여 채널변이를 줄인 음성을 대상으로 멜-주파수 켑스트럼 계수(MFCC) 특징을 추출한 후, 일정크기의 코드북을 구성하는 단계; 입력음성에 대한 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)값과 상기 코드북 중심값과의 거리를 구해 프레임별 채널변이로 추정하는 추정하는 단계; 상기 입력음성에 대한 멜-주파수 켑스트럼 계수(MFCC) 특징열의 평균값을 계산하는 단계; 및 상기 평균값으로 얻어진 채널변이와 상기 시간별 채널변이의 추정으로 구한 평균값을 스무싱(smoothing)한 후 스무싱된 평균값을 각 프레임의 멜-주파수 켑스트럼 계수(MFCC)에서 빼어 채널정규화된 멜-주파수 켑스트럼 계수(MFCC) 특징열을 출력하는 단계를 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|
8 |
8
제 7 항에 있어서, 상기 코드북은 피시에이(PCA: Principle Component Analysis) 기반으로 구성된 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|
9 |
9
제 8 항에 있어서, 상기 PCA기반 코드북은 중심값 개수를 8∼10개로 설계하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|
10 |
10
제 7 항에 있어서, 상기 채널 정규화 방법은 채널정규화의 실시간처리를 위해 이전 발화로부터 얻어진 채널추정값으로 현재 입력발화를 정규화하고, 현재발화의 추정값은 다음 발화를 위해 과거값과 함께 지속적으로 갱신하는 단계를 더 구비한 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|
11 |
11
제 7 항에 있어서, 상기 채널변이 추정 단계는 수학식으로 채널변이를 추정하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|
12 |
12
제 7 항에 있어서, 상기 스무싱 단계는 수학식으로 채널변이를 산출하는 것을 특징으로 하는 강인한 음성인식을 위한 채널 정규화 방법
|