1 |
1
음성 신호를 생성한 화자를 인식하여 상기 화자에 대하여 장치로의 접근을 허용하는 화자 인식 장치에 있어서,
상기 음성 신호를 수신하는 음성 수신부,
상기 수신된 음성 신호를 주파수 영역으로 변환하고, 상기 변환된 음성 신호로부터 N개의 특성을 추출하는 특성 추출부 및
상기 추출된 N개의 특성의 우도(likelihood) 스코어를 산출하고, 상기 산출된 우도(likelihood) 스코어를 이용하여 M개의 상기 추출된 특성으로 이루어진 특성 조합의 우도(likelihood) 스코어를 산출하고, 상기 특성 조합의 우도(likelihood) 스코어에 기초하여 상기 음성 신호를 생성한 화자를 인식하는 매칭부
를 포함하되,
상기 추출된 N개의 특성의 우도(likelihood) 스코어는 하기의 수학식 5에 기초하여 산출하며,
하기의 K는 화자의 정보를 사전에 가우시안 모델로 표현했을 때 상기 가우시안 모델의 구성의 개수이고, 하기의 는 상기 가우시안 모델의 구성에 대한 가중치이고, 하기의 xk는 상기 N개의 특성 중 하나인 특성이고, 하기의 N(xk;,)는 상기 특성 xk에 대한 가우시안 함수이고, 하기의 μ는 평균 벡터이고, 하기의 σ2은 공분산 매트릭스이며, 상기 N 및 M은 자연수이고, 상기 M은 1 이상 N 이하인 것인 화자 인식 장치
|
2 |
2
제 1 항에 있어서,
상기 매칭부는,
적어도 한 명 이상의 화자의 음성 신호 데이터를 저장하는 데이터베이스,
상기 추출된 N개의 각각의 특성의 특성 벡터와 상기 데이터베이스에 저장되어 있는 모든 화자의 음성 신호 데이터 중에서 상기 추출된 N개의 각각의 특성에 대응하는 특성의 특성 벡터를 비교하여, 상기 추출된 N개의 각각의 특성의 우도(likelihood) 스코어를 산출하는 특성 스코어 연산부,
상기 N개의 특성 중, M개의 특성으로 이루어진 특성 조합을 생성하는 특성 조합부,
상기 산출된 우도(likelihood) 스코어를 이용하여 상기 특성 조합의 우도(likelihood) 스코어를 산출하는 특성 조합 스코어 연산부 및
상기 특성 조합의 우도(likelihood) 스코어에 기초하여 상기 음성 신호를 생성한 화자를 인식하는 화자 인식부
를 포함하는 화자 인식 장치
|
3 |
3
제 2 항에 있어서,
상기 화자 인식부가 인식한 화자에 대하여 상기 장치로의 접근을 허용하는 장치 제어부를 더 포함하는 화자 인식 장치
|
4 |
4
제 2 항에 있어서,
상기 화자 인식부는 상기 특성 조합의 우도(likelihood) 스코어가 가장 큰 음성 신호 데이터에 해당하는 화자를 상기 음성 신호를 생성한 화자로 인식하는 것인 화자 인식 장치
|
5 |
5
제 2 항에 있어서,
상기 추출된 N개의 각각의 특성의 우도(likelihood) 스코어를 저장하는 버퍼를 더 포함하는 것인 화자 인식 장치
|
6 |
6
삭제
|
7 |
7
음성 신호를 생성한 화자를 인식하여 상기 화자에 대하여 장치로의 접근을 허용하는 화자 인식 방법에 있어서,
(a) 상기 음성 신호를 수신하는 단계,
(b) 상기 수신된 음성 신호를 주파수 영역으로 변환하고, 상기 변환된 음성 신호로부터 N개의 특성을 추출하는 단계,
(c) 상기 추출된 N개의 각각의 특성의 특성 벡터와 미리 저장되어 있는 모든 화자의 음성 신호 데이터 중에서 상기 추출된 N개의 각각의 특성에 대응하는 특성의 특성 벡터를 비교하여, 상기 추출된 N개의 각각의 특성의 우도(likelihood) 스코어를 산출하는 단계,
(d) 상기 N개의 특성 중, M개의 특성으로 이루어진 특성 조합을 생성하는 단계,
(e) 상기 산출된 우도(likelihood) 스코어를 이용하여 상기 특성 조합의 우도(likelihood) 스코어를 산출하는 단계 및
(f) 상기 특성 조합의 우도(likelihood) 스코어에 기초하여 상기 음성 신호를 생성한 화자를 인식하는 단계
를 포함하되,
상기 (c) 단계는 하기의 수학식 6에 기초하여 상기 추출된 N개의 각각의 특성의 우도(likelihood) 스코어를 산출하며,
하기의 K는 화자의 정보를 사전에 가우시안 모델로 표현했을 때 상기 가우시안 모델의 구성의 개수이고, 하기의 는 상기 가우시안 모델의 구성에 대한 가중치이고, 하기의 xk는 상기 N개의 특성 중 하나인 특성이고, 하기의 N(xk;,)는 상기 특성 xk에 대한 가우시안 함수이고, 하기의 μ는 평균 벡터이고, 하기의 σ2은 공분산 매트릭스이며, 상기 N 및 M은 자연수이고, 상기 M은 1 이상 N 이하인 것인 화자 인식 방법
|
8 |
8
제 7 항에 있어서,
(g) 상기 인식된 화자에 대하여 상기 장치로의 접근을 허용하는 단계를 더 포함하는 화자 인식 방법
|
9 |
9
제 7 항에 있어서,
상기 (f) 단계는 상기 특성 조합의 우도(likelihood) 스코어가 가장 큰 음성 신호 데이터에 해당하는 화자를 상기 음성 신호를 생성한 화자로 인식하는 것인 화자 인식 방법
|
10 |
10
제 7 항에 있어서,
상기 (c) 단계는,
(c1) 상기 추출된 N개의 각각의 특성의 우도(likelihood) 스코어를 저장하는 단계를 포함하는 것인 화자 인식 방법
|
11 |
11
삭제
|