맞춤기술찾기

이전대상기술

영상 정보를 기반으로 음성 구간을 검출하는 방법 및 장치(METHOD AND DEVICE FOR DETECTING VOICE ACTIVITY BASED ON IMAGE INFORMATION)

  • 기술번호 : KST2017017853
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 픽셀값들의 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하여, 상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하는, 방법이 개시된다.
Int. CL G10L 25/93 (2013.01.01) G10L 15/25 (2013.01.01) G06T 7/20 (2017.01.01) G10L 25/78 (2013.01.01)
CPC G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01) G10L 25/93(2013.01)
출원번호/일자 1020177015391 (2015.03.19)
출원인 삼성전자주식회사, 고려대학교 산학협력단
등록번호/일자
공개번호/일자 10-2017-0129676 (2017.11.27) 문서열기
공고번호/일자
국제출원번호/일자 PCT/KR2015/002654 (2015.03.19)
국제공개번호/일자 WO2016148322 (2016.09.22)
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국제출원
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.03.11)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 삼성전자주식회사 대한민국 경기도 수원시 영통구
2 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고한석 서울시 용산구
2 김성수 경기도 부천시 소사구
3 송태엽 서울시 노원구
4 이경선 인천시 남구
5 이재원 서울시 강남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 리앤목특허법인 대한민국 서울 강남구 언주로 **길 **, *층, **층, **층, **층(도곡동, 대림아크로텔)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허법 제203조에 따른 서면
[Patent Application] Document according to the Article 203 of Patent Act
2017.06.05 수리 (Accepted) 1-1-2017-0536409-21
2 수리안내서
Notice of Acceptance
2017.10.30 발송처리완료 (Completion of Transmission) 1-5-2017-0154229-43
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.10 수리 (Accepted) 4-1-2019-5210941-09
4 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2020.03.11 수리 (Accepted) 1-1-2020-0259085-49
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성 구간을 검출하는 방법에 있어서,적어도 하나의 영상에서 입술이 존재하는 영역을 검출하는 단계;상기 검출된 영역에 포함된 픽셀값 들간 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하는 단계;상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하는 단계를 포함하는, 방법
2 2
제1항에 있어서, 상기 특징값을 획득하는 단계는기준 픽셀 및 상기 기준 픽셀의 주변 픽셀들의 평균값을 획득하는 단계;상기 평균값과 상기 기준 픽셀 및 주변 픽셀 간 차이값에 기초하여 상기 특징 값을 획득하는 단계를 포함하는, 방법
3 3
제1항에 있어서, 상기 특징값을 획득하는 단계는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하는 단계;상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는 단계를 포함하는, 방법
4 4
제1항에 있어서, 상기 특징값을 획득하는 단계는상기 차이가 미리 설정된 임계값보다 큰 픽셀의 개수를 상기 적어도 하나의 영상에 대하여 획득하는 단계;상기 영상의 이전 영상 또는 이후 영상 간에 상기 획득된 픽셀 수의 차이를 상기 영상의 특징값으로 획득하는 단계를 포함하는, 방법
5 5
제1항에 있어서, 상기 음성 구간을 검출하는 단계는상기 특징값이 제1 임계값보다 커지면, 상기 특징값의 시점을 음성 구간의 시작점으로 결정하는 단계;상기 특징값이 상기 제1 임계값보다 작아지면, 카운트 값을 0으로 설정하는 단계;상기 특징값이 상기 제1 임계값보다 작아진 시점부터 상기 특징값이 상기 제1 임계값 및 제2 임계값 사이에 존재하는 동안, 상기 카운트 값을 시간이 경과함에 따라 증가시키는 단계;상기 카운트 값이 미리 설정된 갭(gap) 크기보다 커진 시점을 상기 음성 구간의 종료점으로 결정하는 단계를 포함하는, 방법
6 6
음성 구간을 검출하는 방법에 있어서,적어도 하나의 영상에서 입술이 존재하는 영역을 검출하는 단계;상기 검출된 영역에 포함된 각 픽셀에 대한 움직임 정보를 획득하는 단계;분할된 영역이 서로 대칭되도록 상기 검출된 영역을 분할하는 단계;상기 분할된 영역의 움직임 정보의 차이값에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 상기 적어도 하나의 영상에 대하여 획득하는 단계;상기 적어도 하나의 영상의 특징값에 기초하여, 상기 음성 구간을 검출하는 단계를 포함하는, 방법
7 7
제6항에 있어서, 상기 움직임 정보를 획득하는 단계는옵티컬 플로우 방법을 이용하여 상기 각 픽셀에 대한 움직임 정보를 획득하는 단계를 포함하는, 방법
8 8
음성 구간을 검출하는 디바이스에 있어서,사용자의 얼굴을 포함하는 적어도 하나의 영상을 수신하는 수신부;상기 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 픽셀 값들간 차이에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 획득하고, 상기 특징값에 기초하여, 상기 적어도 하나의 영상으로부터 상기 음성 구간을 검출하고, 상기 검출된 음성 구간과 대응되는 음향 신호에 기초하여, 음성 인식을 수행하는 제어부를 포함하는 디바이스
9 9
제8항에 있어서, 상기 제어부는기준 픽셀 및 상기 기준 픽셀의 주변 픽셀들의 평균값을 획득하고, 상기 평균값과 상기 기준 픽셀 및 주변 픽셀 간 차이값에 기초하여 상기 특징 값을 획득하는, 디바이스
10 10
제8항에 있어서, 상기 제어부는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하고, 상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는, 디바이스
11 11
제8항에 있어서, 상기 제어부는상기 각 픽셀 및 주변 픽셀들에 대한 대표값과 상기 주변 픽셀 간 차이에 기초하여, 상기 각 픽셀의 분산 값을 획득하고, 상기 각 픽셀의 분산값에 기초하여, 상기 적어도 하나의 영상의 특징값을 획득하는, 디바이스
12 12
제8항에 있어서, 상기 제어부는상기 특징값이 제1 임계값보다 커지면, 상기 특징값의 시점을 음성 구간의 시작점으로 결정하고, 상기 특징값이 상기 제1 임계값보다 작아지면, 카운트 값을 0으로 설정하고, 상기 특징값이 상기 제1 임계값보다 작아진 시점부터 상기 특징값이 상기 제1 임계값 및 제2 임계값 사이에 존재하는 동안, 상기 카운트 값을 시간이 경과함에 따라 증가시키고, 상기 카운트 값이 미리 설정된 갭(gap) 크기보다 커진 시점을 상기 음성 구간의 종료점으로 결정하는, 디바이스
13 13
음성 구간을 검출하는 디바이스에 있어서,사용자의 얼굴을 포함하는 적어도 하나의 영상을 수신하는 수신부;상기 적어도 하나의 영상에서 입술이 존재하는 영역을 검출하고, 상기 검출된 영역에 포함된 각 픽셀에 대한 움직임 정보를 획득하고, 분할된 영역이 서로 대칭되도록 상기 검출된 영역을 분할하고, 상기 분할된 영역의 움직임 정보의 차이값에 기초하여, 상기 검출된 영역의 입술 움직임에 대한 특징값을 상기 적어도 하나의 영상에 대하여 획득하고, 상기 적어도 하나의 영상의 특징값에 기초하여, 상기 음성 구간을 검출하고, 상기 검출된 음성 구간과 대응되는 음향 신호에 기초하여 음성 인식을 수행하는 제어부를 포함하는 디바이스
14 14
제13항에 있어서, 상기 제어부는옵티컬 플로우 방법을 이용하여 상기 각 픽셀에 대한 움직임 정보를 획득하는, 디바이스
15 15
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20180247651 US 미국 FAMILY
2 WO2016148322 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2018247651 US 미국 DOCDBFAMILY
2 WO2016148322 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
국가 R&D 정보가 없습니다.