1 |
1
스테레오 영상 획득부; 및상기 스테레오 영상 획득부로부터 화자의 스테레오 영상을 수신하고, 상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하고, 상기 추출된 입술 영역의 특징점의 3차원 좌표값에 대응하는 음소를 분류함으로써 화자의 음성을 인식하는 영상 처리부를 포함하고,상기 영상 처리부는, 상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 입술 영역 추출부;상기 입술 영역 추출부에서 추출된 입술 영역의 윤곽을 추출하는 입술 윤곽 추출부;상기 입술 윤곽 추출부에서 추출된 입술 영역의 윤곽에서 특징점을 추출하는 특징점 추출부; 및능동 표현 모델(Active Appearance Model)을 기반으로 상기 입술 영역 추출부와, 상기 입술 윤곽 추출부와, 상기 특징점 추출부를 이용하여 학습 데이터 베이스를 구축하고, 상기 구축된 학습 데이터 베이스를 이용하여 실시간으로 상기 수신된 스테레오 영상으로부터 특징점을 추출하는 능동 표현 모델부를 포함하는 것을 특징으로 하는 음성 인식 장치
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 입술 영역 추출부는 HSV 색공간법을 이용하여 화자의 입술 영역을 검출하는 것을 특징으로 하는 음성 인식 장치
|
4 |
4
제 1 항에 있어서,상기 입술 윤곽 추출부는 캐니(Canny) 경계선 검출 알고리즘를 이용하여 입술 영역의 윤곽을 추출하는 것을 특징으로 하는 음성 인식 장치
|
5 |
5
제 1 항에 있어서,상기 특징점 추출부는 비터비(Viterbi) 알고리즘을 이용하여 특징점들이 최소 거리 간격으로 연결되도록 특징점을 추출하는 것을 특징으로 하는 음성 인식 장치
|
6 |
6
삭제
|
7 |
7
제 1 항에 있어서,상기 영상 처리부는,삼각법을 이용하여 상기 능동 표현 모델부가 추출한 상기 수신된 스테레오 영상의 특징점의 3차원 좌표값을 계산하는 3차원 좌표 계산부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
|
8 |
8
제 7 항에 있어서,상기 영상 처리부는,가우시안 혼합 모델(Gaussian Mixture Model)을 이용하여 상기 3차원 좌표 계산부가 계산한 상기 수신된 스테레오 영상의 특징점의 3차원 좌표값과 대응하는 음소를 분류하는 가우시안 혼합 모델부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
|
9 |
9
제 8 항에 있어서,상기 영상 처리부는,은닉 마코프 모델(Hidden Markov Model)을 이용하여 상기 가우시안 혼합 모델부가 분류한 음소로부터 화자의 단어 또는 문장을 인식하는 은닉 마코프 모델부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
|
10 |
10
제 9 항에 있어서,상기 은닉 마코프 모델부가 인식한 화자의 단어 또는 문장을 TTS(Text to Speech) 시스템을 이용하여 음성으로 출력하는 음성 출력부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
|
11 |
11
스테레오 영상 획득부를 이용하여 화자의 스테레오 영상을 수신하는 단계;상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 단계;상기 추출된 화자의 입술 영역에서 윤곽을 추출하는 단계;상기 추출된 윤곽에서 특징점을 추출하는 단계;상기 추출된 특징점을 이용하여 능동 표현 모델(Active Appearance Model)을 학습시키는 단계;상기 수신된 스테레오 영상을 상기 능동 표현 모델에 입력하여 실시간으로 특징점을 추출하는 단계;상기 능동 표현 모델로부터 실시간으로 추출되는 특징점의 3차원 좌표값을 계산하는 단계;상기 계산된 3차원 좌표값과 대응하는 음소의 정적 패턴 분류를 수행하는 단계; 및상기 음소의 정적 패턴 분류 결과로부터 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 단계를 포함하는 음성 인식 방법
|
12 |
12
제 11 항에 있어서,상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 단계는,HSV 색공간법을 이용하여 화자의 입술 영역을 추출하는 것을 특징으로 하는 음성 인식 방법
|
13 |
13
제 11 항에 있어서,상기 추출된 화자의 입술 영역에서 윤곽을 추출하는 단계는,캐니(Canny) 경계선 검출 알고리즘을 이용하여 윤곽을 추출하는 것을 특징으로 하는 음성 인식 방법
|
14 |
14
제 11 항에 있어서,상기 추출된 윤곽에서 특징점을 추출하는 단계는,비터비(Viterbi) 알고리즘을 이용하여 특징점들이 최소 거리 간격으로 연결되도록 특징점을 추출하는 것을 특징으로 하는 음성 인식 방법
|
15 |
15
제 11 항에 있어서,상기 능동 표현 모델로부터 실시간으로 추출되는 특징점들의 3차원 좌표값을 계산하는 단계는,삼각법을 이용하여 3차원 좌표값을 계산하는 것을 특징으로 하는 음성 인식 방법
|
16 |
16
제 11 항에 있어서,상기 계산된 3차원 좌표값에 대응하는 음소의 정적 패턴 분류를 수행하는 단계는,가우시안 혼합 모델(Gaussian Mixture Model)을 이용하여 음소의 정적 패턴 분류를 수행하는 것을 특징으로 하는 음성 인식 방법
|
17 |
17
제 11 항에 있어서,상기 음소의 정적 패턴 분류의 결과로서 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 단계는,은닉 마코프 모델(Hidden Markov Model)을 이용하여 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 것을 특징으로 하는 음성 인식 방법
|