1 |
1
사용자 단말에서의 음성 인식 시스템에 있어서,사용자의 음성을 입력받는 음성 입력부,상기 입력받은 음성을 디지털 신호로 변환하는 음성 신호 변환부,음성 데이터 샘플이 저장된 저장부 및상기 변환된 디지털 신호의 음성학적 특성을 분석하는 음성 신호 분석부 및 상기 음성 신호 분석부에서 분석한 음성학적 특성과 상기 저장된 음성 데이터 샘플을 비교하고, 상기 비교 결과에 기초하여 상기 변환된 상기 디지털 신호를 보정하는 음성 신호 보정부를 포함하되,상기 음성학적 특성은 음절 당 발성 속도, 발성 중 묵음 시간 및 음성의 포먼트 주파수를 포함하며, 상기 음성 신호 보정부는 상기 음성학적 특성이 음절 당 발성 속도인 경우, 상기 음성 신호 분석부를 통하여 분석된 디지털 신호의 음절 당 발성 속도를 상기 저장부에 저장된 음성 데이터 샘플의 발성 속도와 비교하여, 기 설정된 임계 범위를 벗어날 경우 상기 디지털 신호의 발성 속도를 상기 음성 데이터 샘플의 발성 속도로 보정하고, 상기 음성학적 특성이 발성 중 묵음 시간인 경우, 상기 음성 신호 분석부를 통하여 분석된 디지털 신호의 묵음 시간을 상기 저장부에 저장된 음성 데이터 샘플의 묵음 시간과 비교하여, 기 설정된 임계 범위를 벗어날 경우 특징요소에 기초하여, 상기 디지털 신호의 묵음 시간을 상기 음성 데이터 샘플의 묵음 시간으로 보정하며,상기 음성학적 특성이 음성의 포먼트 주파수인 경우, 상기 음성 신호 분석부를 통하여 분석된 디지털 신호의 포먼트 주파수를 상기 저장부에 저장된 음성 데이터 샘플의 포먼트 주파수와 비교하여, 기 설정된 범위를 벗어날 경우, 상기 디지털 신호의 복수의 포먼트 주파수 중 하나 이상의 포먼트 주파수 대역의 에너지를 선택적으로 조절하는 것이며, 상기 특징요소는 상기 사용자의 성대 질환 유무에 기초하여 추출된 것인 음성 인식 시스템
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서,상기 음성 신호 보정부는 상기 분석된 음절 당 발성 속도 중 상기 기 설정된 임계 범위를 벗어난 특정 음절을 보정하여, 상기 디지털 신호를 상기 음성 데이터 샘플의 발성 속도로 보정하는 것인 음성 인식 시스템
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
제 1 항에 있어서,상기 음성 신호 보정부는 상기 복수의 포먼트 주파수 중 약화된 포먼트 주파수를 주파수 대역 이퀄라이징 방법에 기초하여 강화시킴으로써 상기 디지털 신호를 보정하는 것인 음성 인식 시스템
|
8 |
8
제 1 항에 있어서,상기 음성 신호 보정부는 상기 음성 신호 분석부를 통하여 분석된 상기 디지털 신호의 포먼트 주파수 에너지 비율 중 기설정된 범위를 벗어난 상기 디지털 신호의 포먼트 주파수 에너지 비율에 대하여 상기 저장된 음성 데이터 샘플의 포먼트 주파수 에너지 비율과 동일하도록 포먼트 에너지를 조절하여 상기 디지털 신호의 인식률을 보정하는 것인 음성 인식 시스템
|
9 |
9
제 1 항에 있어서, 상기 음성 신호 보정부는 상기 음성 신호 분석부를 통하여 분석된 상기 디지털 신호의 포먼트 주파수를 상기 저장부에 저장된 음성 데이터 샘플의 포먼트 주파수와 비교하여, 기 설정된 범위를 벗어날 경우, 상기 디지털 신호의 복수의 포먼트 주파수 중 하나 이상의 포먼트 주파수 대역의 위치를 조정하여 상기 디지털 신호를 보정하는 것인 음성 인식 시스템
|
10 |
10
사용자 단말에서의 음성 인식 방법에 있어서,사용자의 음성을 입력받는 단계,상기 입력받은 음성을 디지털 신호로 변환하는 단계,상기 변환된 디지털 신호의 음성학적 특성을 분석하는 단계 및상기 음성학적 특성을 분석하는 단계에서 분석한 음성학적 특성을 저장된 음성 데이터 샘플과 비교하고, 상기 비교 결과에 기초하여 상기 디지털 신호를 보정하는 단계를 포함하되,상기 음성학적 특성은 음절 당 발성 속도, 발성 중 묵음 시간 및 음성의 포먼트 주파수를 포함하며, 상기 디지털 신호를 보정하는 단계는, 상기 음성학적 특성이 음절 당 발성 속도인 경우, 상기 음성 신호 분석하는 단계를 통하여 분석된 상기 디지털 신호의 음절 당 발성 속도를 저장부에 저장된 음성 데이터 샘플의 발성 속도와 비교하여, 기 설정된 임계 범위를 벗어날 경우 상기 디지털 신호의 발성 속도를 상기 음성 데이터 샘플의 발성 속도로 보정하고,상기 음성학적 특성이 발성 중 묵음 시간인 경우, 상기 음성 신호 분석하는 단계를 통하여 분석된 상기 디지털 신호의 묵음 시간을 상기 저장부에 저장된 음성 데이터 샘플의 묵음 시간과 비교하여, 기 설정된 임계 범위를 벗어날 경우 특징요소에 기초하여, 상기 디지털 신호의 묵음 시간을 상기 음성 데이터 샘플의 묵음 시간으로 보정하며,상기 음성학적 특성이 음성의 포먼트 주파수인 경우, 상기 음성 신호 분석하는 단계를 통하여 분석된 상기 디지털 신호의 포먼트 주파수를 상기 저장부에 저장된 음성 데이터 샘플의 포먼트 주파수와 비교하여, 기 설정된 범위를 벗어날 경우, 상기 디지털 신호의 복수의 포먼트 주파수 중 하나 이상의 포먼트 주파수 대역의 에너지를 선택적으로 조절하는 것이며,상기 특징요소는 상기 사용자의 성대 질환 유무에 기초하여 상기 음성 신호로부터 추출된 것인 음성 인식 방법
|
11 |
11
삭제
|
12 |
12
삭제
|
13 |
13
삭제
|
14 |
14
삭제
|
15 |
15
제 10 항에 있어서,상기 디지털 신호를 보정하는 단계는, 상기 복수의 포먼트 주파수 중 하나 이상의 포먼트 주파수 대역 약화된 포먼트 주파수를 주파수 대역 이퀄라이징 방법에 기초하여 강화시킴으로써 상기 디지털 신호를 보정하는 것인 음성 인식 방법
|
16 |
16
제 10 항에 있어서,상기 디지털 신호를 보정하는 단계는, 상기 음성 신호 분석하는 단계를 통하여 분석된 상기 디지털 신호의 포먼트 주파수를 상기 저장된 음성 데이터 샘플의 포먼트 주파수와 비교하여, 기 설정된 범위를 벗어날 경우, 상기 디지털 신호의 복수의 포먼트 주파수 중 하나 이상의 포먼트 주파수 대역의 위치를 조정하여 상기 디지털 신호를 보정하는 것인 음성 인식 방법
|