맞춤기술찾기

이전대상기술

발화자의 거리 추정을 이용한 음성인식방법 및 음성인식장치

  • 기술번호 : KST2015143850
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른 발화자의 거리 추정을 이용한 음성인식방법은 음성인식장치가 카메라로 촬영한 발화자의 얼굴 영상을 이용하여 음성인식장치와 발화자 사이의 발화자 거리를 추정하는 단계(510), 음성인식장치가 발화자 거리와 기준거리의 차(差)를 기준으로 발화자의 음성에 대한 레벨을 조절하는 단계(520) 및 음성인식장치가 조절된 음성을 이용하여 음성인식을 수행하는 단계(530)를 포함한다.
Int. CL G10L 15/24 (2006.01) G10L 25/57 (2013.01)
CPC G10L 25/57(2013.01) G10L 25/57(2013.01) G10L 25/57(2013.01)
출원번호/일자 1020130008751 (2013.01.25)
출원인 성균관대학교산학협력단
등록번호/일자 10-1430342-0000 (2014.08.07)
공개번호/일자 10-2014-0095853 (2014.08.04) 문서열기
공고번호/일자 (20140813) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.01.25)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 홍광석 대한민국 경기 과천시 관문로 ***,
2 오병훈 대한민국 경기 수원시 장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 남정길 대한민국 서울특별시 강남구 테헤란로**길 **, 인화빌딩 *층 (삼성동)(특허법인(유한)아이시스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 경기도 수원시 장안구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.01.25 수리 (Accepted) 1-1-2013-0075333-76
2 선행기술조사의뢰서
Request for Prior Art Search
2013.08.22 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2013.10.10 수리 (Accepted) 9-1-2013-0077398-22
4 의견제출통지서
Notification of reason for refusal
2014.02.20 발송처리완료 (Completion of Transmission) 9-5-2014-0121819-58
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2014.04.21 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2014-0376503-03
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2014.04.21 수리 (Accepted) 1-1-2014-0376476-57
7 등록결정서
Decision to grant
2014.08.05 발송처리완료 (Completion of Transmission) 9-5-2014-0537140-56
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.02.23 수리 (Accepted) 4-1-2017-5028829-43
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
음성인식방법에 있어서,음성인식장치가 카메라로 촬영한 발화자의 얼굴 영상을 이용하여 상기 음성인식장치와 발화자 사이의 발화자 거리를 추정하는 단계;상기 음성인식장치가 상기 발화자 거리와 기준거리의 차(差)를 기준으로 상기 발화자의 음성에 대한 레벨을 조절하는 단계; 및상기 음성인식장치가 상기 조절된 음성을 이용하여 음성인식을 수행하는 단계를 포함하되,상기 거리를 추정하는 단계에서 상기 발화자 거리(Person to Camera Distance)는 상기 얼굴 영상에서 얼굴 영역을 검출하여 아래의 식으로 연산되는 발화자의 거리 추정을 이용한 음성인식방법
2 2
제1항에 있어서,상기 추정하는 단계는상기 카메라가 얼굴 영역을 포함하는 소스 영상을 획득하는 단계;상기 음성인식장치의 프로세서가 상기 소스 영상을 전처리하는 단계;상기 음성인식장치의 프로세서가 상기 전처리한 소스 영상에서 아다부스트 알고리즘을 이용하여 얼굴 영역을 검출하는 단계; 및상기 음성인식장치의 프로세서가 상기 얼굴 영역을 이용하여 상기 발화자 거리를 연산하는 단계를 포함하는 발화자의 거리 추정을 이용한 음성인식방법
3 3
제2항에 있어서,상기 전처리하는 단계는상기 소스 영상에서 R, G 및 B 각각의 채널에 모폴로지컬 그레디언트의 최대값 픽셀만을 결합하여 모폴로지컬 그레디언트 이미지를 생성하는 단계;상기 소스 영상을 YCbCr 컬러로 변환하고 노이즈를 제거하여 상기 소스 영상에서 배경을 제거한 타겟 이미지를 생성하는 단계; 및상기 모폴로지컬 그레디언트 이미지와 상기 타겟 이미지를 결합하는 단계를 포함하는 발화자의 거리 추정을 이용한 음성인식방법
4 4
삭제
5 5
제1항에 있어서,상기 조절하는 단계는상기 음성인식장치가 마이크를 사용하여 상기 발화자의 음성을 입력받는 단계; 및상기 음성인식장치가 상기 발화자 거리와 기준거리의 차에 대한 상기 음성인식장치와 상기 발화자 사이의 최대 거리의 비율을 이용하여 상기 음성의 레벨을 변경하는 단계를 포함하는 발화자의 거리 추정을 이용한 음성인식방법
6 6
제5항에 있어서,상기 변경하는 단계는 상기 입력되는 음성에 아래의 수식을 이용하여 연산되는 가중치(Namp)를 곱하여 상기 음성의 레벨을 변경하는 발화자의 거리 추정을 이용한 음성인식방법
7 7
제1항에 있어서,상기 수행하는 단계는상기 조절된 음성에 대한 MFCC 파라미터를 추출하고, HMM 인식 알고리즘을 사용하는 발화자의 거리 추정을 이용한 음성인식방법
8 8
음성인식장치에 있어서,발화자의 얼굴 영역을 포함하는 소스 영상을 입력받는 영상 입력부;상기 얼굴 영역을 이용하여 상기 음성인식장치와 발화자 사이의 발화자 거리를 추정하는 거리 추정부;상기 발화자의 음성을 입력받는 음성 입력부; 및상기 발화자 거리와 기준거리의 차(差)를 기준으로 상기 발화자의 음성에 대한 레벨을 조절하고, 상기 조절된 음성을 이용하여 음성을 인식하는 음성 인식부를 포함하되,상기 거리 추정부는 아래의 식으로 상기 발화자 거리(Person to Camera Distance)를 연산하는 발화자의 거리 추정을 이용한 음성인식장치
9 9
제8항에 있어서,상기 거리 추정부는상기 소스 영상에 대한 모폴로지컬 그레디언트 이미지 및 상기 소스 영상에 대한 YCbCr 컬러 이미지를 결합하여 상기 소스 영상을 전처리하는 전처리부;상기 전처리한 소스 영상에서 아다부스트 알고리즘을 이용하여 얼굴 영역을 검출하는 얼굴 영역 검출부; 및 상기 얼굴 영역을 이용하여 상기 발화자 거리를 연산하는 거리 연산부를 포함하는 발화자의 거리 추정을 이용한 음성인식장치
10 10
제9항에 있어서,상기 전처리부는상기 소스 영상에서 R, G 및 B 각각의 채널에 모폴로지컬 그레디언트의 최대값 픽셀만을 결합하여 모폴로지컬 그레디언트 이미지를 생성하고, 상기 소스 영상을 YCβCρ 컬러로 변환하고 노이즈를 제거하여 상기 소스 영상에서 배경을 제거한 타겟 이미지를 생성하고, 상기 모폴로지컬 그레디언트 이미지와 상기 타겟 이미지를 결합하는 발화자의 거리 추정을 이용한 음성인식장치
11 11
삭제
12 12
제8항에 있어서,상기 음성 인식부는상기 발화자 거리와 기준거리의 차에 대한 상기 음성인식장치와 상기 발화자 사이의 최대 거리의 비율을 이용하여 상기 음성에 대한 레벨을 조절하는 발화자의 거리 추정을 이용한 음성인식장치
13 13
제12항에 있어서,상기 음성 인식부는상기 음성 입력부를 통해 입력되는 상기 음성에 아래의 수식을 이용하여 연산되는 가중치(Namp)를 곱하여 상기 음성에 대한 레벨을 조절하는 발화자의 거리 추정을 이용한 음성인식장치
14 14
제8항에 있어서,상기 음성 인식부는 상기 조절된 음성에 대한 MFCC 파라미터를 추출하고, HMM 인식 알고리즘을 수행하는 발화자의 거리 추정을 이용한 음성인식장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 정부)지경부 성균관대학교 2012년 대학IT연구센터 육성지원사업 유비쿼터스 응용을 위한 HCI 기반 기술 연구
2 정부)교과부 성균관대학교 대학중점연구소지원사업 1단계3/3차년도(3/9년) 컨버젼스연구소(첨단 인터랙션을 위한 기반 소프트웨어 융합기술 연구)