맞춤기술찾기

이전대상기술

환경 변화에 강인한 멀티모달 사용자 인식

  • 기술번호 : KST2015190866
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 외부 환경 변화에 따른 모달리티의 결합 또는 선택을 통하여 사용자 인식 성능을 향상시키기 위한 방법을 제공한다. 본 발명은 멀티 모달 사용자 인식 방법에 관한 것으로, 얼굴 모델 템플릿(face model templates)을 이용하여 입력 영상의 얼굴 특징 벡터에 대한 얼굴 유사도를 계산하는 단계; 음성 모델 템플릿(speech model templates)을 이용하여 입력 오디오의 음성 특징 벡터에 대한 음성 유사도를 계산하는 단계; 상기 입력 영상과 연관된 조명의 크기를 이용하여 얻어진 제1 가중치를 상기 얼굴 유사도에 적용하여 제1 값을 생성하는 단계; 상기 입력 오디오와 연관된 잡음의 크기를 이용하여 얻어진 제2 가중치를 상기 음성 유사도에 적용하여 제2 값을 생성하는 단계; 및 상기 제1 값 및 상기 제2 값을 결합하여 얻어진 최종 스코어를 이용하여, 사용자를 인식하는 단계를 포함하는 멀티 모달 사용자 인식 방법을 제공한다.
Int. CL G06K 9/68 (2006.01) G06K 9/46 (2006.01)
CPC G06K 9/68(2013.01) G06K 9/68(2013.01)
출원번호/일자 1020130123325 (2013.10.16)
출원인 재단법인대구경북과학기술원
등록번호/일자 10-1514551-0000 (2015.04.16)
공개번호/일자 10-2015-0042674 (2015.04.21) 문서열기
공고번호/일자 (20150424) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020130120508   |   2013.10.10
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.10.16)
심사청구항수 9

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 재단법인대구경북과학기술원 대한민국 대구 달성군 현

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김동주 대한민국 대구 달성군 현풍면 테크노중앙대로 ***, 대구
2 이상헌 대한민국 대구광역시 수성구
3 손명규 대한민국 대구 달서구
4 김현덕 대한민국 대구 동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 무한 대한민국 서울특별시 강남구 언주로 ***, *층(역삼동,화물재단빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 재단법인대구경북과학기술원 대한민국 대구 달성군 현
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.10.16 수리 (Accepted) 1-1-2013-0933955-46
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.11.11 수리 (Accepted) 4-1-2013-5149764-85
3 선행기술조사의뢰서
Request for Prior Art Search
2014.05.07 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2014.06.13 수리 (Accepted) 9-1-2014-0051209-59
5 의견제출통지서
Notification of reason for refusal
2014.07.16 발송처리완료 (Completion of Transmission) 9-5-2014-0483485-92
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2014.09.11 수리 (Accepted) 1-1-2014-0861281-05
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2014.09.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2014-0861282-40
8 의견제출통지서
Notification of reason for refusal
2014.12.23 발송처리완료 (Completion of Transmission) 9-5-2014-0880712-18
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.02.17 수리 (Accepted) 1-1-2015-0168356-43
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.02.17 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0168357-99
11 등록결정서
Decision to grant
2015.04.14 발송처리완료 (Completion of Transmission) 9-5-2015-0248834-67
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.12.18 수리 (Accepted) 4-1-2018-5260250-39
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.18 수리 (Accepted) 4-1-2020-5134633-04
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
멀티 모달 사용자 인식 방법에 있어서,얼굴 모델 템플릿(face model templates)을 이용하여 입력 영상의 얼굴 특징 벡터에 대한 얼굴 유사도를 계산하는 단계;음성 모델 템플릿(speech model templates)을 이용하여 입력 오디오의 음성 특징 벡터에 대한 음성 유사도를 계산하는 단계;상기 입력 영상과 연관된 조명의 크기를 이용하여 얻어진 제1 가중치를 상기 얼굴 유사도에 적용하여 제1 값을 생성하는 단계;상기 입력 오디오와 연관된 잡음의 크기를 이용하여 얻어진 제2 가중치를 상기 음성 유사도에 적용하여 제2 값을 생성하는 단계; 및상기 제1 값 및 상기 제2 값을 결합하여 얻어진 최종 스코어를 이용하여, 사용자를 인식하는 단계를 포함하고,상기 제1 가중치는, 얼굴 학습 데이터의 조명 크기 및 얼굴 테스트 데이터의 조명 크기에 따른 인식률을 이용하여 획득하고,상기 제2 가중치는, 음성 학습 데이터의 잡음 크기 및 음성 테스트 데이터의 잡음 크기에 따른 인식률을 이용하여 획득하는 것을 특징으로 하는 멀티 모달 사용자 인식 방법
2 2
제1항에 있어서,상기 입력 영상과 연관된 조명의 크기를 이용하여 얻어진 제1 가중치를 상기 얼굴 유사도에 적용하여 제1 값을 생성하는 단계는,상기 얼굴 학습 데이터의 조명 크기 및 상기 얼굴 테스트 데이터의 조명 크기에 따른 인식률을 저장하는 얼굴 인식률 테이블을 유지하는 단계;상기 입력 영상과 연관된 상기 조명의 크기를 추정하는 단계;상기 얼굴 인식률 테이블 및 상기 추정된 조명의 크기를 이용하여 상기 제1 가중치를 계산하는 단계; 및상기 얼굴 유사도에 상기 제1 가중치를 적용하여 상기 제1 값을 생성하는 단계를 포함하는 멀티 모달 사용자 인식 방법
3 3
제2항에 있어서,상기 입력 영상과 연관된 상기 조명의 크기를 추정하는 단계는,레티넥스(Retinex) 알고리즘을 이용하여 상기 입력 영상과 연관된 상기 조명의 크기를 추정하는 단계를 포함하는 멀티 모달 사용자 인식 방법
4 4
제1항에 있어서,상기 입력 오디오와 연관된 잡음의 크기를 이용하여 얻어진 제2 가중치를 상기 음성 유사도에 적용하여 제2 값을 생성하는 단계는,상기 음성 학습 데이터의 잡음 크기 및 상기 음성 테스트 데이터의 잡음 크기에 따른 인식률을 저장하는 음성 인식률 테이블을 유지하는 단계;상기 입력 오디오와 연관된 잡음의 크기를 추정하는 단계;상기 음성 인식률 테이블 및 상기 추정된 잡음의 크기를 이용하여 상기 제2 가중치를 계산하는 단계; 및상기 음성 유사도에 상기 제2 가중치를 적용하여 상기 제2 값을 생성하는 단계를 포함하는 멀티 모달 사용자 인식 방법
5 5
제4항에 있어서,상기 입력 오디오와 연관된 잡음의 크기를 추정하는 단계는,SNNR을 이용하여 상기 입력 오디오와 연관된 잡음의 크기를 추정하는 단계를 포함하는 멀티 모달 사용자 인식 방법
6 6
제2항 또는 제4항에 있어서,상기 얼굴 모델 템플릿은 상기 얼굴 학습 데이터와 연관되고,상기 음성 모델 템플릿은 상기 음성 학습 데이터와 연관되는멀티 모달 사용자 인식 방법
7 7
제1항에 있어서,상기 제1 가중치를 계산하는 단계 및 상기 제2 가중치를 계산하는 단계는,얼굴 학습 데이터의 조명 크기 및 얼굴 테스트 데이터의 조명 크기에 따른 인식률을 저장하는 얼굴 인식률 테이블을 유지하는 단계;음성 학습 데이터의 잡음 크기 및 음성 테스트 데이터의 잡음 크기에 따른 인식률을 저장하는 음성 인식률 테이블을 유지하는 단계;상기 얼굴 인식률 테이블, 상기 얼굴 유사도가 가장 높은 것으로 결정된 얼굴 학습 데이터 및 추정된 조명의 크기를 이용하여 제1 인식률을 계산하는 단계;상기 음성 인식률 테이블, 상기 음성 유사도가 가장 높은 것으로 결정된 음성 학습 데이터 및 추정된 잡음의 크기를 이용하여 제2 인식률을 계산하는 단계;상기 제1 인식률 및 상기 제2 인식률을 이용하여 상기 얼굴 유사도에 대한 제1 가중치를 계산하는 단계; 및상기 제1 인식률 및 상기 제2 인식률을 이용하여 상기 음성 유사도에 대한 제2 가중치를 계산하는 단계를 포함하는 멀티 모달 사용자 인식 방법
8 8
멀티 모달 사용자 인식 방법에 있어서,얼굴 학습 데이터의 조명 크기 및 얼굴 테스트 데이터의 조명 크기에 따른 인식률을 저장하는 얼굴 인식률 테이블을 유지하는 단계;음성 학습 데이터의 잡음 크기 및 음성 테스트 데이터의 잡음 크기에 따른 인식률을 저장하는 음성 인식률 테이블을 유지하는 단계;입력 영상과 연관된 조명의 크기 및 입력 오디오와 연관된 잡음의 크기를 추정하는 단계;상기 얼굴 인식률 테이블 및 상기 추정된 조명의 크기를 이용하여 제1 인식률을 계산하는 단계;상기 음성 인식률 테이블 및 상기 추정된 음성의 크기를 이용하여 제2 인식률을 계산하는 단계;상기 제1 인식률 및 상기 제2 인식률의 차가 미리 정해진 임계값보다 큰 경우 더 큰 인식률을 가진 모달리티를 이용하여 사용자를 인식하는 단계를 포함하는 멀티 모달 사용자 인식 방법
9 9
제8항에 있어서,상기 입력 영상으로부터 얼굴 영역을 검출하는 단계;상기 입력 오디오로부터 음성 영역을 검출하는 단계;상기 검출된 얼굴 영역으로부터 얼굴 특징 벡터를 추출하는 단계;상기 검출된 음성 영역으로부터 음성 특징 벡터를 추출하는 단계;얼굴 모델 템플릿(face model templates)을 이용하여 입력 영상의 얼굴 특징 벡터에 대한 얼굴 유사도를 계산하는 단계; 및음성 모델 템플릿(speech model templates)을 이용하여 입력 오디오의 음성 특징 벡터에 대한 음성 유사도를 계산하는 단계를 더 포함하는 멀티 모달 사용자 인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.