맞춤기술찾기

이전대상기술

스테레오 카메라 기반의 3차원 실시간 입술 특징점 추출을 이용한 음성 인식 장치 및 음성 인식 방법

  • 기술번호 : KST2014049567
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 스테레오 영상으로부터 추출된 입술 특징점을 이용한 음성 인식 장치 및 음성 인식 방법에 관한 것이다. 이를 위해 본 발명의 일실시예에 따른 음성 인식 장치는 스테레오 영상 획득부와, 상기 스테레오 영상 획득부로부터 화자의 스테레오 영상을 수신하고, 수신된 스테레오 영상에서 화자의 입술 영역을 추출하고, 추출된 입술 영여그이 특징점의 3차원 좌표값에 대응하는 음소를 분류함으로써 화자의 음성을 인식하는 영상 처리부를 포함한다. 영상 처리부는 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 입술 영역 추출부와, 입술 영역 추출부에서 추출된 입술 영역의 윤곽을 추출하는 입술 윤곽 추출부와, 입술 윤곽 추출부에서 추출된 입술 영역의 윤곽에서 특징점을 추출하는 특징점 추출부를 포함할 수 있다.
Int. CL G10L 15/24 (2006.01) G10L 15/14 (2006.01)
CPC G10L 15/25(2013.01) G10L 15/25(2013.01) G10L 15/25(2013.01) G10L 15/25(2013.01) G10L 15/25(2013.01) G10L 15/25(2013.01) G10L 15/25(2013.01)
출원번호/일자 1020110011507 (2011.02.09)
출원인 한국과학기술연구원
등록번호/일자 10-1187600-0000 (2012.09.26)
공개번호/일자 10-2012-0091625 (2012.08.20) 문서열기
공고번호/일자 (20121008) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2011.02.09)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술연구원 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 윤인찬 대한민국 서울특별시 광진구
2 최귀원 대한민국 서울특별시 동대문구
3 서준교 미국 서울특별시 광진구
4 권익찬 대한민국 서울특별시 노원구
5 김광명 대한민국 서울특별시 구로구
6 추준욱 대한민국 충청북도 청원군
7 최재봉 대한민국 서울특별시 성북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김영철 대한민국 서울특별시 종로구 종로*길 **, **층 케이씨엘특허법률사무소 (수송동, 석탄회관빌딩)
2 김 순 영 대한민국 서울특별시 종로구 종로*길 **, **층 케이씨엘특허법률사무소 (수송동, 석탄회관빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 폭스박스 경기도 수원시 영통구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2011.02.09 수리 (Accepted) 1-1-2011-0092794-74
2 선행기술조사의뢰서
Request for Prior Art Search
2011.12.19 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2012.01.16 수리 (Accepted) 9-1-2012-0005334-66
4 의견제출통지서
Notification of reason for refusal
2012.02.27 발송처리완료 (Completion of Transmission) 9-5-2012-0114299-72
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2012.04.02 수리 (Accepted) 1-1-2012-0263000-53
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2012.04.02 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2012-0262999-59
7 등록결정서
Decision to grant
2012.09.21 발송처리완료 (Completion of Transmission) 9-5-2012-0561659-78
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.19 수리 (Accepted) 4-1-2014-5022002-69
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
스테레오 영상 획득부; 및상기 스테레오 영상 획득부로부터 화자의 스테레오 영상을 수신하고, 상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하고, 상기 추출된 입술 영역의 특징점의 3차원 좌표값에 대응하는 음소를 분류함으로써 화자의 음성을 인식하는 영상 처리부를 포함하고,상기 영상 처리부는, 상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 입술 영역 추출부;상기 입술 영역 추출부에서 추출된 입술 영역의 윤곽을 추출하는 입술 윤곽 추출부;상기 입술 윤곽 추출부에서 추출된 입술 영역의 윤곽에서 특징점을 추출하는 특징점 추출부; 및능동 표현 모델(Active Appearance Model)을 기반으로 상기 입술 영역 추출부와, 상기 입술 윤곽 추출부와, 상기 특징점 추출부를 이용하여 학습 데이터 베이스를 구축하고, 상기 구축된 학습 데이터 베이스를 이용하여 실시간으로 상기 수신된 스테레오 영상으로부터 특징점을 추출하는 능동 표현 모델부를 포함하는 것을 특징으로 하는 음성 인식 장치
2 2
삭제
3 3
제 1 항에 있어서,상기 입술 영역 추출부는 HSV 색공간법을 이용하여 화자의 입술 영역을 검출하는 것을 특징으로 하는 음성 인식 장치
4 4
제 1 항에 있어서,상기 입술 윤곽 추출부는 캐니(Canny) 경계선 검출 알고리즘를 이용하여 입술 영역의 윤곽을 추출하는 것을 특징으로 하는 음성 인식 장치
5 5
제 1 항에 있어서,상기 특징점 추출부는 비터비(Viterbi) 알고리즘을 이용하여 특징점들이 최소 거리 간격으로 연결되도록 특징점을 추출하는 것을 특징으로 하는 음성 인식 장치
6 6
삭제
7 7
제 1 항에 있어서,상기 영상 처리부는,삼각법을 이용하여 상기 능동 표현 모델부가 추출한 상기 수신된 스테레오 영상의 특징점의 3차원 좌표값을 계산하는 3차원 좌표 계산부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
8 8
제 7 항에 있어서,상기 영상 처리부는,가우시안 혼합 모델(Gaussian Mixture Model)을 이용하여 상기 3차원 좌표 계산부가 계산한 상기 수신된 스테레오 영상의 특징점의 3차원 좌표값과 대응하는 음소를 분류하는 가우시안 혼합 모델부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
9 9
제 8 항에 있어서,상기 영상 처리부는,은닉 마코프 모델(Hidden Markov Model)을 이용하여 상기 가우시안 혼합 모델부가 분류한 음소로부터 화자의 단어 또는 문장을 인식하는 은닉 마코프 모델부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
10 10
제 9 항에 있어서,상기 은닉 마코프 모델부가 인식한 화자의 단어 또는 문장을 TTS(Text to Speech) 시스템을 이용하여 음성으로 출력하는 음성 출력부를 더 포함하는 것을 특징으로 하는 음성 인식 장치
11 11
스테레오 영상 획득부를 이용하여 화자의 스테레오 영상을 수신하는 단계;상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 단계;상기 추출된 화자의 입술 영역에서 윤곽을 추출하는 단계;상기 추출된 윤곽에서 특징점을 추출하는 단계;상기 추출된 특징점을 이용하여 능동 표현 모델(Active Appearance Model)을 학습시키는 단계;상기 수신된 스테레오 영상을 상기 능동 표현 모델에 입력하여 실시간으로 특징점을 추출하는 단계;상기 능동 표현 모델로부터 실시간으로 추출되는 특징점의 3차원 좌표값을 계산하는 단계;상기 계산된 3차원 좌표값과 대응하는 음소의 정적 패턴 분류를 수행하는 단계; 및상기 음소의 정적 패턴 분류 결과로부터 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 단계를 포함하는 음성 인식 방법
12 12
제 11 항에 있어서,상기 수신된 스테레오 영상에서 화자의 입술 영역을 추출하는 단계는,HSV 색공간법을 이용하여 화자의 입술 영역을 추출하는 것을 특징으로 하는 음성 인식 방법
13 13
제 11 항에 있어서,상기 추출된 화자의 입술 영역에서 윤곽을 추출하는 단계는,캐니(Canny) 경계선 검출 알고리즘을 이용하여 윤곽을 추출하는 것을 특징으로 하는 음성 인식 방법
14 14
제 11 항에 있어서,상기 추출된 윤곽에서 특징점을 추출하는 단계는,비터비(Viterbi) 알고리즘을 이용하여 특징점들이 최소 거리 간격으로 연결되도록 특징점을 추출하는 것을 특징으로 하는 음성 인식 방법
15 15
제 11 항에 있어서,상기 능동 표현 모델로부터 실시간으로 추출되는 특징점들의 3차원 좌표값을 계산하는 단계는,삼각법을 이용하여 3차원 좌표값을 계산하는 것을 특징으로 하는 음성 인식 방법
16 16
제 11 항에 있어서,상기 계산된 3차원 좌표값에 대응하는 음소의 정적 패턴 분류를 수행하는 단계는,가우시안 혼합 모델(Gaussian Mixture Model)을 이용하여 음소의 정적 패턴 분류를 수행하는 것을 특징으로 하는 음성 인식 방법
17 17
제 11 항에 있어서,상기 음소의 정적 패턴 분류의 결과로서 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 단계는,은닉 마코프 모델(Hidden Markov Model)을 이용하여 화자의 단어 또는 문장의 동적 패턴 인식을 수행하는 것을 특징으로 하는 음성 인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.