1 |
1
화자로부터 수신한 음성신호를 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식장치에 있어서,상기 화자인식장치는,상기 화자로부터 음성신호를 수신하는 음성수신부;수신한 상기 음성신호에서 주파수 특징을 추출하는 전처리부;추출된 상기 주파수 특징을 이용하여 상기 화자가 기등록된 사용자인지 여부를 판단하는 화자인식부; 및 상기 음성수신부, 상기 전처리부 및 상기 화자인식부의 동작을 제어하는 제어부;를 포함하되,상기 제어부는, 기등록된 사용자 여부 판단을 위해 상기 기등록된 사용자의 제 1 음성신호에서 추출한 제 1 주파수 특징을 포함하는 제 1 사용자 모델을 생성하고, 생성된 상기 제 1 사용자 모델을 데이터베이스에 저장하도록 제어하며,상기 음성수신부가 상기 화자로부터 제 2 음성신호를 수신하도록 제어하고,상기 전처리부가 수신된 상기 제 2 음성신호에서 제 2 주파수 특징을 추출하도록 제어하며,상기 화자인식부가, 저장된 상기 제 1 사용자 모델에 포함된 상기 제 1 주파수 특징과 상기 제 2 주파수 특징의 일치 여부에 따라 상기 화자가 상기 기등록된 사용자인지 여부를 판단하도록 제어하고,상기 음성수신부가 상기 기등록된 사용자로부터 제 3 음성신호를 수신한 경우,수신된 상기 제 3 음성신호를 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
|
2 |
2
제 1 항에 있어서,상기 제어부는 상기 데이터베이스에 저장된 배경 화자 모델(Universal background model)를 상기 제 1 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 생성하는 것을 특징으로 하는, 화자인식장치
|
3 |
3
제 2 항에 있어서,상기 제어부는 상기 데이터베이스에 저장된 상기 제 1 사용자 모델을, 상기 제 3 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자인식장치
|
4 |
4
제 3 항에 있어서,상기 제 1 사용자 모델의 갱신을 위해, 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 부족음소탐색부;를 더 포함하고,상기 부족음소탐색부는 상기 제 1 사용자 모델을 상기 배경 화자 모델과 비교하여 상기 제 1 음소를 탐색하며,상기 음성수신부는 탐색된 상기 제 1 음소를 포함하는 제 3 음성신호를 상기 기등록된 사용자로부터 수신하고,상기 제어부는 수신한 제 3 음성신호를 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
|
5 |
5
제 4 항에 있어서,상기 부족음소탐색부는,상기 제 1 음소를 탐색하기 위해, 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하고,상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 것을 특징으로 하는, 화자인식장치
|
6 |
6
제 4 항에 있어서,상기 부족음소탐색부는,상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트와 상기 제 1 가우시안에 대응되고, 상기 제 1 사용자 모델에 포함된 제 2 가우시안 컴퍼넌트를 비교하고,상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 것을 특징으로 하는, 화자인식장치
|
7 |
7
제 4 항에 있어서,상기 제어부는,갱신 전의 제 1 사용자 모델의 보완을 위해 상기 부족음소탐색부가 상기 제 1 음소를 탐색하도록 제어하고,탐색된 상기 제 1 음소를 포함하는 상기 제 3 음성신호를 상기 음성수신부가 상기 기등록된 사용자로부터 수신하도록 제어하며,갱신전의 제 1 사용자 모델을 수신된 상기 제 3 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자 인식 장치
|
8 |
8
제 4 항에 있어서,상기 제어부는,갱신 전의 제 1 사용자 모델의 보완을 위해 상기 부족음소탐색부가 상기 제 1 음소를 탐색하도록 제어하고,탐색된 상기 제 1 음소를 포함하는 상기 제 3 음성신호를 상기 음성수신부가 상기 기등록된 사용자로부터 수신하도록 제어하며,상기 제 1 음성신호와 상기 제 3 음성신호를 결합하여 제 5 음성신호를 생성하고,상기 데이터베이스에 저장된 배경 화자 모델을 상기 제 5 음성신호를 이용한 적응학습을 통해 갱신하는 것을 특징으로 하는, 화자 인식 장치
|
9 |
9
제 3 항에 있어서,상기 제어부는,상기 제 3 음성신호를 상기 기등록된 사용자에게 발화 요구를 하여 상기 음성수신부를 통해 수신하도록 제어하는 것을 특징으로 하는, 화자인식장치
|
10 |
10
제 3 항에 있어서,상기 제어부는,상기 음성수신부를 통해 상기 기등록된 사용자의 일상생활 중의 제 4 음성신호를 수신하도록 제어하고,상기 수신된 제 4 음성신호를 상기 데이터베이스에 저장하며,상기 저장된 제 4 음성신호를 상기 제 3 음성신호로 이용하여 상기 제 1 사용자 모델을 갱신하는 것을 특징으로 하는, 화자인식장치
|
11 |
11
제어부가 데이터베이스에 배경 화자 모델(Universal background model)를 저장하는 제 1 단계;음성수신부가 제 1 음성신호를 수신하는 제 2 단계;상기 제어부가 수신된 제 1 음성신호를 이용하여 사용자를 등록하는 제 3 단계;상기 제어부가, 수신된 상기 제 1 음성신호를 상기 배경 화자 모델에 적응하여 등록된 사용자에 관한 제 1 사용자 모델을 생성하는 제 4 단계;상기 제어부가, 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 제 5 단계;상기 음성수신부가 상기 제 1 음소를 포함하는 제 2 음성신호를 상기 사용자로부터 수신하는 제 6 단계; 및상기 제어부가, 수신된 상기 제 2 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 갱신하는 제 7 단계;를 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
12 |
12
제 11 항에 있어서,상기 제 4 단계는,상기 제어부가 수신한 상기 제 1 음성신호를 분할하는 단계;상기 제어부가 분할된 상기 제 1 음성신호에서 특징 벡터를 추출하는 단계; 및상기 제어부가 상기 배경 화자 모델을 추출된 상기 특징 벡터에 맞게 변형 적응하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
13 |
13
제 11 항에 있어서,상기 제 5 단계는,부족음소탐색부가 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하는 단계; 및상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
14 |
14
제 11 항에 있어서,부족음소탐색부가 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트와 상기 제 1 가우시안에 대응되고, 상기 제 1 사용자 모델에 포함된 제 2 가우시안 컴퍼넌트를 비교하는 단계;상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우,상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
15 |
15
제 11 항에 있어서,상기 제 6 단계는,상기 제어부가 상기 제 2 음성신호를 상기 사용자에게 발화 요구를 하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
16 |
16
제 11 항에 있어서,상기 제 6 단계는,상기 음성수신부가 상기 사용자의 일상생활에서 제 3 음성신호를 수신하는 단계;상기 제어부가 수신된 상기 제 3 음성신호를 상기 데이터베이스에 저장하는 단계; 및상기 제어부가 저장된 상기 제 3 음성신호를 가공하여 상기 제 2 음성신호로 변환하는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
17 |
17
제 11 항에 있어서,상기 제 7 단계는,상기 제어부가 상기 제 1 음성신호와 상기 제 2 음성신호를 결합하여 제 4 음성신호를 생성하는 단계;상기 제어부가 상기 배경 화자 모델에 상기 제 4 음성신호를 적응하여 제 2 사용자 모델을 생성하는 단계; 및상기 제어부가 상기 제 1 사용자 모델을 상기 제 2 사용자 모델로 대체 시키는 단계;를 더 포함하는 것을 특징으로 하는, 화자인식을 위해 사용자 모델을 보완하는 방법
|
18 |
18
화자인식을 위해 사용자 모델을 보완하는 방법을 수행하기 위하여 디지털 처리 장치에 의해 실행될 수 있는 명령어들의 프로그램이 유형적으로 구현되어 있고, 상기 디지털 처리 장치에 의해 판독될 수 있는 기록매체에 있어서,제어부가 데이터베이스에 배경 화자 모델(Universal background model)를 저장하는 기능;음성수신부가 제 1 음성신호를 수신하는 기능;상기 제어부가 수신된 제 1 음성신호를 이용하여 사용자를 등록하는 기능;상기 제어부가 수신된 상기 제 1 음성신호를 상기 배경 화자 모델에 적응하여 등록된 사용자에 관한 제 1 사용자 모델을 생성하는 기능;상기 제어부가 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 기능;상기 음성수신부가 상기 제 1 음소를 포함하는 제 2 음성신호를 상기 사용자로부터 수신하는 기능; 및상기 제어부가 상기 수신된 제 2 음성신호를 이용한 적응학습을 통해 상기 제 1 사용자 모델을 갱신하는 기능;을 포함하되,상기 제어부가 생성된 상기 제 1 사용자 모델의 보완을 위한 제 1 음소를 탐색하는 기능은,부족음소탐색부가 상기 제 1 사용자 모델에, 상기 배경 화자 모델에 포함된 제 1 가우시안 컴퍼넌트에 대응되는 제 2 가우시안 컴퍼넌트가 포함되었는지 여부를 판단하는 기능;상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 불포함시, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 기능;상기 제 2 가우시안 컴퍼넌트가 상기 제 1 사용자 모델에 포함시, 상기 제 1 가우시안 컴퍼넌트와 상기 제 2 가우시안 컴퍼넌트를 비교하는 기능; 및상기 제 2 가우시안 컴퍼넌트의 분산비율이 상기 제 1 가우시안 컴퍼넌트의 분산비율보다 작은 경우, 상기 제 1 가우시안 컴퍼넌트에 해당하는 음소를 상기 제 1 음소로 결정하는 기능;을 실행시키도록 하는 기록매체
|
19 |
19
삭제
|