맞춤기술찾기

이전대상기술

구문 독립 화자 인식 장치 및 방법

  • 기술번호 : KST2019034216
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 실시예에 따른 화자 인식 장치 및 방법화자의 음성 데이터 및 화자의 얼굴 전체 또는 일부가 포함된 이미지 데이터를 획득하는 음성/이미지 획득부, 기지정된 패턴 인식 기법에 따라 미리 학습되어 이미지 데이터로부터 구문 의존적인 이미지 특징을 추출하고, 음성 데이터로부터 구문에 무관한 음성 특징을 추출하며, 이미지 특징을 가중치로 하여 음성 특징의 특징값을 획득하는 특징 추출부 및 특징값을 미리 저장된 화자 식별값과 비교하여 화자를 판별하는 화자 판별부를 포함한다.
Int. CL G10L 17/02 (2013.01.01) G10L 17/04 (2013.01.01) G06K 9/00 (2006.01.01) G10L 17/18 (2013.01.01)
CPC G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01) G10L 17/02(2013.01)
출원번호/일자 1020180060925 (2018.05.29)
출원인 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2019-0135657 (2019.12.09) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.05.29)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이상훈 서울특별시 강남구
2 이경준 서울특별시 서초구
3 강지우 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 민영준 대한민국 서울특별시 강남구 남부순환로 ****, *층(도곡동, 차우빌딩)(맥스국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 대한민국 서울특별시 서대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.05.29 수리 (Accepted) 1-1-2018-0524957-38
2 의견제출통지서
Notification of reason for refusal
2019.05.28 발송처리완료 (Completion of Transmission) 9-5-2019-0378009-25
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.07.26 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0770788-12
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.07.26 수리 (Accepted) 1-1-2019-0770848-53
5 등록결정서
Decision to grant
2019.12.27 발송처리완료 (Completion of Transmission) 9-5-2019-0935854-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
화자의 음성 데이터 및 상기 화자의 얼굴 전체 또는 일부가 포함된 이미지 데이터를 획득하는 음성/이미지 획득부; 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 이미지 데이터로부터 구문 의존적인 이미지 특징을 추출하고, 상기 음성 데이터로부터 구문에 무관한 음성 특징을 추출하며, 상기 이미지 특징을 가중치로 하여 상기 음성 특징의 특징값을 획득하는 특징 추출부; 및 상기 특징값을 미리 저장된 화자 식별값과 비교하여 상기 화자를 판별하는 화자 판별부; 를 포함하되,상기 특징 추출부는 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 이미지 데이터로부터 구문 의존적인 상기 화자의 표정 또는 입 모양 중 하나에 대한 상기 이미지 특징을 추출하는 이미지 특징 추출부; 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 음성 데이터로부터 구문에 무관한 상기 화자의 음정의 높낮이, 음색, 음조 중 적어도 하나에 대한 상기 음성 특징을 추출하는 음성 특징 추출부; 및 상기 음성 특징에 상기 이미지 특징을 가중치로 적용하고, 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 음성 특징으로부터 상기 특징값을 추출하는 통합 특징 추출부; 를 포함하는 화자 인식 장치
2 2
삭제
3 3
삭제
4 4
제1항에 있어서, 상기 이미지 특징 추출부는 상기 이미지 데이터가 단일 프레임의 이미지 데이터이면, 미리 학습된 2D CNN(2D Convolutional Neural Networks)으로 구현되고, 상기 이미지 데이터가 다수 프레임의 이미지 데이터이면, 미리 학습된 3D CNN(3D Convolutional Neural Networks)으로 구현되고, 상기 음성 특징 추출부는 미리 학습된 2D CNN으로 구현되는 화자 인식 장치
5 5
제1 항에 있어서, 상기 통합 특징 추출부는 미리 학습된 2D CNN으로 구현되는 화자 인식 장치
6 6
제1 항에 있어서, 상기 화자 인식 장치는 상기 음성/이미지 획득부에서 동영상 데이터가 인가되면, 상기 동영상 데이터를 상기 음성 데이터 및 상기 이미지 데이터로 분리하는 음성/이미지 변환부; 를 더 포함하는 화자 인식 장치
7 7
화자의 음성 데이터 및 상기 화자의 얼굴 전체 또는 일부가 포함된 이미지 데이터를 획득하는 단계; 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 이미지 데이터로부터 구문 의존적인 이미지 특징을 추출하고, 상기 음성 데이터로부터 구문에 무관한 음성 특징을 추출하며, 상기 이미지 특징을 가중치로 하여 상기 음성 특징의 특징값을 획득하는 단계; 및 상기 특징값을 미리 저장된 화자 식별값과 비교하여 상기 화자를 판별하는 단계; 를 포함하되,상기 특징값을 획득하는 단계는 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 이미지 데이터로부터 구문 의존적인 상기 화자의 표정 또는 입 모양 중 하나에 대한 상기 이미지 특징을 추출하는 단계; 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 음성 데이터로부터 구문에 무관한 상기 화자의 음정의 높낮이, 음색, 음조 중 적어도 하나에 대한 상기 음성 특징을 추출하는 단계; 및 상기 음성 특징에 상기 이미지 특징을 가중치로 적용하고, 기지정된 패턴 인식 기법에 따라 미리 학습되어 상기 음성 특징으로부터 상기 특징값을 추출하는 단계; 를 포함하는 화자 인식 방법
8 8
삭제
9 9
삭제
10 10
제7 항에 있어서, 상기 이미지 특징을 추출하는 단계는 상기 이미지 데이터가 단일 프레임의 이미지 데이터이면, 미리 학습된 2D CNN(2D Convolutional Neural Networks)을 이용하여 상기 이미지 특징을 추출하고, 상기 이미지 데이터가 다수 프레임의 이미지 데이터이면, 미리 학습된 3D CNN(3D Convolutional Neural Networks)을 이용하여 상기 이미지 특징을 추출하며, 상기 특징값으로 추출하는 단계는 미리 학습된 2D CNN 을 이용하여 상기 특징값을 추출하는 화자 인식 방법
11 11
제7 항에 있어서, 상기 음성 특징을 추출하는 단계는 미리 학습된 2D CNN 을 이용하여 상기 음성 특징을 추출하는 화자 인식 방법
12 12
제7 항에 있어서, 상기 화자 인식 방법은 상기 이미지 데이터를 획득하는 단계에서 동영상 데이터가 획득되면, 상기 동영상 데이터를 상기 음성 데이터 및 상기 이미지 데이터로 분리하는 단계; 를 더 포함하는 화자 인식 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신방송연구개발사업 [이지바로][주관/한국과학기술원]상대방의 감성을 추론, 판단하여 그에 맞추어 대화하고 대응할 수 있는 감성지능 기술 연구개발(2/5)