1 |
1
사용자를 촬영하여 비전 정보를 생성하고, 상기 사용자로부터 발화된 음성을 인식하여 생성된 인식 단어 정보와 상기 비전 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 영상 기반 음성 인식 장치
를 포함하고,
상기 영상 기반 음성 인식 장치는 상기 인식 단어 정보에서 제1 음소 순서 정보를 추출하고, 상기 비전 정보에서 제2 음소 순서 정보를 추출하며, 상기 제1 및 제2 음소 순서 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하며,
상기 영상 기반 음성 인식 장치는, 상기 인식 단어 정보의 아스키 코드를 분석하여 음절별 모음을 추출하고, 상기 추출된 모음에 대응하는 음소 그룹을 결정하며, 상기 결정된 음소 그룹에 따라 상기 제1 음소 순서 정보를 생성하는
음성 인식 시스템
|
2 |
2
제1항에서,
상기 사용자로부터 발화된 음성을 인식하여 상기 인식 단어 정보를 생성하고 상기 인식 단어 정보를 상기 영상 기반 음성 인식 장치에 제공하는 음성 기반 음성 인식 장치를 더 포함하는 음성 인식 시스템
|
3 |
3
제1항에서,
상기 영상 기반 음성 인식 장치는 상기 비전 정보로부터 상기 사용자가 발화한 모음을 추출하여 음소 그룹별로 분류하는 음성 인식 시스템
|
4 |
4
제3항에서,
상기 음소 그룹은 각 모음의 특징 요소의 유사도에 따라 나뉘는 음성 인식 시스템
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
제1항에서,
상기 영상 기반 음성 인식 장치는, 상기 비전 정보를 기초로 입술 모양의 특징 요소의 값을 계산하고, 상기 계산된 특징 요소 값에 대응하는 음소 그룹에 따라 상기 제2 음소 순서 정보를 생성하는 음성 인식 시스템
|
8 |
8
제7항에서,
상기 특징 요소는 입술 폭, 입술 높이, 상기 입술 폭과 상기 입술 높이의 비율 및 입술 면적 중 적어도 하나를 포함하는 음성 인식 시스템
|
9 |
9
제7항에서,
상기 영상 기반 음성 인식 장치는, 상기 특징 요소에 기초한 특징 요소 공간에 각 음소 그룹을 구분하여 두고 최대 우도 값을 이용하여 상기 계산된 특징 요소 값에 대응하는 음소 그룹을 추출하는 음성 인식 시스템
|
10 |
10
제1항 내지 제4항 및 제7항 내지 제9항 중 어느 한 항의 음성 인식 시스템을 포함하는 로봇 시스템
|
11 |
11
제1항 내지 제4항 및 제7항 내지 제9항 중 어느 한 항의 음성 인식 시스템을 포함하는 대화 시스템
|
12 |
12
사용자를 촬영하여 비전 정보를 생성하는 단계, 그리고
상기 사용자로부터 발화된 음성 신호를 인식하여 생성된 인식 단어 정보와 상기 비전 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 단계
를 포함하고,
상기 결정 단계는,
상기 인식 단어 정보에서 제1 음소 순서 정보를 추출하는 단계,
상기 비전 정보에서 제2 음소 순서 정보를 추출하는 단계, 그리고
상기 제1 및 제2 음소 순서 정보에 따라 상기 인식 단어 정보의 채택 여부를 결정하는 단계를 포함하며,
상기 제1 음소 순서 정보 추출 단계는,
상기 인식 단어 정보의 아스키 코드를 분석하여 음절별 모음을 추출하는 단계,
상기 추출된 모음에 대응하는 음소 그룹을 결정하는 단계, 그리고
상기 결정된 음소 그룹에 따라 상기 제1 음소 순서 정보를 생성하는 단계를 포함하는
음성 인식 방법
|
13 |
13
삭제
|
14 |
14
제12항에서,
상기 결정 단계는 상기 비전 정보로부터 상기 사용자가 발화한 모음을 추출하여 음소 그룹별로 분류하는 단계를 포함하는 음성 인식 방법
|
15 |
15
제14항에서,
상기 음소 그룹은 각 모음의 특징 요소의 유사도에 따라 나뉘는 음성 인식 방법
|
16 |
16
삭제
|
17 |
17
삭제
|
18 |
18
제12항에서,
상기 제2 음소 순서 정보 추출 단계는,
상기 비전 정보를 기초로 입술 모양의 특징 요소의 값을 계산하는 단계, 그리고
상기 계산된 특징 요소 값에 대응하는 음소 그룹에 따라 상기 제2 음소 순서 정보를 생성하는 단계를 포함하는 음성 인식 방법
|
19 |
19
제18항에서,
상기 특징 요소는 입술 폭, 입술 높이, 상기 입술 폭과 상기 입술 높이의 비율 및 입술 면적 중 적어도 하나를 포함하는 음성 인식 방법
|
20 |
20
제18항에서,
상기 제2 음소 순서 정보 추출 단계는 상기 특징 요소에 기초한 특징 요소 공간에 각 음소 그룹을 구분하여 두고 최대 우도 값을 이용하여 상기 계산된 특징 요소 값에 대응하는 음소 그룹을 추출하는 단계를 더 포함하는 음성 인식 방법
|
21 |
21
컴퓨터에 제12항, 제14항, 제15항, 그리고 제18항 내지 제20항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
|