1 |
1
음성인식 단말기로부터 입력된 음성에 대응하는 음성 데이터 및 상기 음성의 입력 환경에 대응하는 멀티센서 데이터를 수신하는 통신모듈;이전 멀티센서 데이터를 기반으로 음성 입력 환경에 따라 구분된 복수의 언어 및 음향 모델 중 상기 멀티센서 데이터에 대응하는 임의의 언어 및 음향 모델을 선정하는 모델선정모듈; 및상기 음성 데이터에서 추출된 특징 벡터를 상기 임의의 언어 및 음향 모델에 적용하여, 상기 음성 데이터에 대한 음성인식결과를 상기 음성인식 단말기로 전송되게 상기 통신모듈을 제어하는 음성인식모듈;을 포함하는 음성인식장치
|
2 |
2
제 1 항에 있어서,상기 멀티센서 데이터는,상기 음성인식 단말기의 위치 및 장소에 대한 위치 데이터, 상기 음성을 입력하는 화자의 영상 데이터 및 상기 음성인식 단말기와 상기 화자 사이의 거리에 대한 근접 데이터 중 적어도 하나를 포함하는 음성인식장치
|
3 |
3
제 2 항에 있어서,상기 모델선정모듈은,상기 위치 데이터를 기반으로 상기 음성인식 단말기의 위치 및 장소를 추정하는 제1 추정부;상기 영상 데이터를 기반으로 상기 화자의 연령을 추정하는 제2 추정부; 상기 근접 데이터를 기반으로 상기 음성 데이터에 대한 신호대잡음비(SNR)를 추정하는 제3 추정부; 및상기 제1 내지 제3 추정부에서 추정된 상기 위치 및 장소, 상기 연령 및 상기 신호대잡음비를 기반으로 상기 임의의 언어 및 음향 모델을 선정하는 선정부;를 포함하는 음성인식장치
|
4 |
4
제 2 항에 있어서,상기 모델선정모듈은,상기 이전 멀티센서 데이터를 기반으로 음성 입력 환경에 따라 구분된 상기 복수의 언어 및 음향 모델을 저장하는 데이터베이스;를 더 포함하는 음성인식장치
|
5 |
5
제 1 항에 있어서,상기 음성인식모듈은,상기 음성 데이터에서 상기 특징 벡터를 추출하는 전처리부; 및상기 특징 벡터를 상기 임의의 언어 및 음향 모델에 적용하여, 상기 음성 데이터에 대한 음성인식결과를 상기 음성인식 단말기로 전송되게 상기 통신모듈을 제어하는 음성인식부;를 포함하는 음성인식장치
|
6 |
6
제 5 항에 있어서,상기 전처리부는,상기 음성 데이터를 프레임 단위로 구분하여, 각 프레임 별로 잡음 성분을 제거하여 상기 특징 벡터를 추출하는 음성인식장치
|
7 |
7
음성인식 단말기로부터 입력된 음성에 대응하는 음성 데이터 및 상기 음성의 입력 환경에 대응하는 멀티센서 데이터를 수신하는 단계;이전 멀티센서 데이터를 기반으로 음성 입력 환경에 따라 구분된 복수의 언어 및 음향 모델 중 상기 멀티센서 데이터에 대응하는 임의의 언어 및 음향 모델을 선정하는 단계; 및상기 음성 데이터에서 추출된 특징 벡터를 상기 임의의 언어 및 음향 모델에 적용하여, 상기 음성 데이터에 대한 음성인식결과를 상기 음성인식 단말기로 전송하는 단계;를 포함하는 음성인식장치의 동작방법
|
8 |
8
제 7 항에 있어서,상기 멀티센서 데이터는,상기 음성인식 단말기의 위치 및 장소에 대한 위치 데이터, 상기 음성을 입력하는 화자의 영상 데이터 및 상기 음성인식 단말기와 상기 화자 사이의 거리에 대한 근접 데이터 중 적어도 하나를 포함하는 음성인식장치의 동작방법
|
9 |
9
제 7 항에 있어서,상기 선정 단계는,상기 위치 데이터를 기반으로 상기 음성인식 단말기의 위치 및 장소를 추정하는 단계;상기 영상 데이터를 기반으로 상기 화자의 연령을 추정하는 단계;상기 근접 데이터를 기반으로 상기 음성 데이터에 대한 신호대잡음비(SNR)를 추정하는 단계; 및상기 제1 내지 제3 추정부에서 추정된 상기 위치 및 장소, 상기 연령 및 상기 신호대잡음비를 기반으로 상기 임의의 언어 및 음향 모델을 선정하는 단계;를 포함하는 음성인식장치의 동작방법
|
10 |
10
제 7 항에 있어서,상기 전송 단계는,상기 음성 데이터에서 상기 특징 벡터를 추출하는 단계; 및상기 특징 벡터를 상기 임의의 언어 및 음향 모델에 적용하여, 상기 음성 데이터에 대한 음성인식결과를 상기 음성인식 단말기로 전송하는 단계;를 포함하는 음성인식장치의 동작방법
|
11 |
11
제 9 항에 있어서,상기 추출 단계는,상기 음성 데이터를 프레임 단위로 구분하여, 각 프레임 별로 잡음 성분을 제거하여 상기 특징 벡터를 추출하는 음성인식장치의 동작방법
|