1 |
1
음성 구간을 검출하는 방법에 있어서,적어도 하나의 영상에서 입술이 존재하는 영역을 검출하는 단계;상기 검출된 영역에 포함된 픽셀값 들간 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하는 단계;상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하는 단계를 포함하는, 방법
|
2 |
2
제1항에 있어서, 상기 특징값을 획득하는 단계는기준 픽셀 및 상기 기준 픽셀의 주변 픽셀들의 평균값을 획득하는 단계;상기 평균값과 상기 기준 픽셀 및 주변 픽셀 간 차이값에 기초하여 상기 특징 값을 획득하는 단계를 포함하는, 방법
|
3 |
3
제1항에 있어서, 상기 특징값을 획득하는 단계는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하는 단계;상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는 단계를 포함하는, 방법
|
4 |
4
제1항에 있어서, 상기 특징값을 획득하는 단계는상기 차이가 미리 설정된 임계값보다 큰 픽셀의 개수를 상기 적어도 하나의 영상에 대하여 획득하는 단계;상기 영상의 이전 영상 또는 이후 영상 간에 상기 획득된 픽셀 수의 차이를 상기 영상의 특징값으로 획득하는 단계를 포함하는, 방법
|
5 |
5
제1항에 있어서, 상기 음성 구간을 검출하는 단계는상기 특징값이 제1 임계값보다 커지면, 상기 특징값의 시점을 음성 구간의 시작점으로 결정하는 단계;상기 특징값이 상기 제1 임계값보다 작아지면, 카운트 값을 0으로 설정하는 단계;상기 특징값이 상기 제1 임계값보다 작아진 시점부터 상기 특징값이 상기 제1 임계값 및 제2 임계값 사이에 존재하는 동안, 상기 카운트 값을 시간이 경과함에 따라 증가시키는 단계;상기 카운트 값이 미리 설정된 갭(gap) 크기보다 커진 시점을 상기 음성 구간의 종료점으로 결정하는 단계를 포함하는, 방법
|
6 |
6
음성 구간을 검출하는 방법에 있어서,적어도 하나의 영상에서 입술이 존재하는 영역을 검출하는 단계;상기 검출된 영역에 포함된 각 픽셀에 대한 움직임 정보를 획득하는 단계;분할된 영역이 서로 대칭되도록 상기 검출된 영역을 분할하는 단계;상기 분할된 영역의 움직임 정보의 차이값에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 상기 적어도 하나의 영상에 대하여 획득하는 단계;상기 적어도 하나의 영상의 특징값에 기초하여, 상기 음성 구간을 검출하는 단계를 포함하는, 방법
|
7 |
7
제6항에 있어서, 상기 움직임 정보를 획득하는 단계는옵티컬 플로우 방법을 이용하여 상기 각 픽셀에 대한 움직임 정보를 획득하는 단계를 포함하는, 방법
|
8 |
8
음성 구간을 검출하는 디바이스에 있어서,사용자의 얼굴을 포함하는 적어도 하나의 영상을 수신하는 수신부;상기 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 픽셀 값들간 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하고, 상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하고, 상기 검출된 음성 구간과 대응되는 음향 신호에 기초하여, 음성 인식을 수행하는 제어부를 포함하는 디바이스
|
9 |
9
제8항에 있어서, 상기 제어부는기준 픽셀 및 상기 기준 픽셀의 주변 픽셀들의 평균값을 획득하고, 상기 평균값과 상기 기준 픽셀 및 주변 픽셀 간 차이값에 기초하여 상기 특징 값을 획득하는, 디바이스
|
10 |
10
제8항에 있어서, 상기 제어부는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하고, 상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는, 디바이스
|
11 |
11
제8항에 있어서, 상기 제어부는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하고, 상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는, 디바이스
|
12 |
12
제8항에 있어서, 상기 제어부는상기 특징값이 제1 임계값보다 커지면, 상기 특징값의 시점을 음성 구간의 시작점으로 결정하고, 상기 특징값이 상기 제1 임계값보다 작아지면, 카운트 값을 0으로 설정하고, 상기 특징값이 상기 제1 임계값보다 작아진 시점부터 상기 특징값이 상기 제1 임계값 및 제2 임계값 사이에 존재하는 동안, 상기 카운트 값을 시간이 경과함에 따라 증가시키고, 상기 카운트 값이 미리 설정된 갭(gap) 크기보다 커진 시점을 상기 음성 구간의 종료점으로 결정하는, 디바이스
|
13 |
13
음성 구간을 검출하는 디바이스에 있어서,사용자의 얼굴을 포함하는 적어도 하나의 영상을 수신하는 수신부;상기 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 각 픽셀에 대한 움직임 정보를 획득하고, 분할된 영역이 서로 대칭되도록 상기 검출된 영역을 분할하고, 상기 분할된 영역의 움직임 정보의 차이값에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 상기 적어도 하나의 영상에 대하여 획득하고, 상기 적어도 하나의 영상의 특징값에 기초하여, 상기 음성 구간을 검출하고, 상기 검출된 음성 구간과 대응되는 음향 신호에 기초하여 음성 인식을 수행하는 제어부를 포함하는 디바이스
|
14 |
14
제13항에 있어서, 상기 제어부는옵티컬 플로우 방법을 이용하여 상기 각 픽셀에 대한 움직임 정보를 획득하는, 디바이스
|
15 |
15
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체
|