맞춤기술찾기

이전대상기술

추론 과정 설명이 가능한 시각 질의 응답 장치 및 방법

  • 기술번호 : KST2019015767
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 실시예들은 시각 질의 응답 모델에 복수의 영역 맵을 추가함으로써 정답뿐만 아니라 정답을 추론하는 과정에서 선택된 영역들 및 영역들이 선택된 순서가 무엇인지 출력하고, 복수의 영역 특징을 결합하여 문장 생성 모델에 적용함으로써 이미지와 함께 정답이 아닌 객체에 관한 설명 문장을 출력할 수 있는 시각 질의 응답 장치 및 방법을 제공한다.
Int. CL G06F 16/00 (2019.01.01)
CPC G06F 16/56(2013.01)
출원번호/일자 1020180011339 (2018.01.30)
출원인 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2019-0092043 (2019.08.07) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.01.30)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 변혜란 서울특별시 서대문구
2 홍종광 서울특별시 서대문구
3 어영정 서울특별시 서대문구
4 김호성 서울특별시 서대문구
5 김태형 서울특별시 서대문구
6 황선희 서울특별시 서대문구
7 기민송 서울특별시 서대문구
8 홍용원 서울특별시 서대문구
9 임광용 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인우인 대한민국 서울특별시 강남구 역삼로 ***, *층(역삼동, 중평빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 서울특별시 서대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.01.30 수리 (Accepted) 1-1-2018-0105369-30
2 의견제출통지서
Notification of reason for refusal
2019.04.05 발송처리완료 (Completion of Transmission) 9-5-2019-0250120-28
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.05.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0533952-56
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.05.24 수리 (Accepted) 1-1-2019-0533951-11
5 등록결정서
Decision to grant
2019.10.18 발송처리완료 (Completion of Transmission) 9-5-2019-0754183-71
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
시각 질의 응답 장치에 의한 시각 질의 응답 방법에 있어서,정답 추론부에 의해 정답 추론 모델의 복수의 레이어 사이에 적어도 하나의 영역 맵을 추가하고 상기 정답 추론 모델을 기반으로 이미지와 관련된 질문 벡터에 대하여 정답을 추론하는 단계; 및정답 설명부에 의해 상기 적어도 하나의 영역 맵을 이용하여 상기 정답을 추론하기 위한 설명 가능한 질문에 응답하는 단계를 포함하며,상기 설명 가능한 질문은 (i) 상기 정답이 상기 이미지에서 어디에 위치하는지에 관한 제1 질문, (ii) 상기 정답이 추론되는 과정에서 선택된 영역들 및 상기 영역들이 선택된 순서에 관한 제2 질문, (iii) 상기 이미지에서 상기 정답이 아닌 객체 영역이 상기 정답에 해당하지 않는 이유에 관한 제3 질문, 또는 이들의 조합에 관한 것을 특징으로 하는 시각 질의 응답 방법
2 2
제1항에 있어서,상기 정답 추론 모델은 N(상기 N은 자연수) 개의 레이어를 포함하며, N-K (상기 K는 상기 N보다 작은 자연수)번째의 레이어 내지 N 번째의 레이어에 각각 대응하는 시각 특징을 추출하고 상기 N-K 번째의 레이어 내지 상기 N 번째의 레이어에 각각 대응하는 시각 특징 및 상기 질문 벡터를 기반으로 학습하여, 상기 이미지를 복수의 조각으로 분할하고 상기 N-K 번째의 레이어 내지 상기 N 번째의 레이어에 각각 대응하도록 상기 정답을 추론하는 데 필요한 영역을 예측하기 위한 K 개의 영역 맵을 생성하는 것을 특징으로 하는 시각 질의 응답 방법
3 3
제2항에 있어서,상기 정답 추론 모델은 상기 N 개의 레이어 중에서 일부 레이어를 단계별로 기억 학습하며, 상기 N-K 번째의 레이어부터 상기 N 번째의 레이어까지 수용 영역(Reception Field)의 크기를 순차적으로 감소시켜 적용하는 것을 특징으로 하는 시각 질의 응답 방법
4 4
제1항에 있어서,상기 질문 벡터는 장단기 메모리(Long Short Term Memory, LSTM) 구조의 순환신경망(Recurrent Neural Network, RNN)을 기반으로 질문을 인코딩하여 생성되며 의미론적 관계 정보를 포함하는 것을 특징으로 하는 시각 질의 응답 방법
5 5
삭제
6 6
제1항에 있어서,상기 설명 가능한 질문에 응답하는 단계는,상기 제1 질문에 대하여 상기 복수의 레이어 중에서 최종 레이어에 대응하는 시각 특징에 상기 영역 맵을 반영하여 상기 이미지에서 상기 정답의 위치를 표시하는 것을 특징으로 하는 시각 질의 응답 방법
7 7
제1항에 있어서,상기 설명 가능한 질문에 응답하는 단계는,상기 제2 질문에 대하여 상기 복수의 레이어 중에서 일부 레이어에 대응하는 복수의 시각 특징에 복수의 영역 맵을 각각 반영한 영역 특징들을 상기 이미지에서 순서대로 표시하는 것을 특징으로 하는 시각 질의 응답 방법
8 8
제1항에 있어서,상기 설명 가능한 질문에 응답하는 단계는,상기 제3 질문에 대하여 상기 복수의 레이어 중에서 일부 레이어에 대응하는 복수의 시각 특징에 복수의 영역 맵을 각각 반영한 영역 특징들을 게이트 순환 유닛(Gated Recurrent Unit, GRU)에 입력하여 대답 문장을 생성하는 것을 특징으로 하는 시각 질의 응답 방법
9 9
정답 추론 모델의 복수의 레이어 사이에 적어도 하나의 영역 맵을 추가하고 상기 정답 추론 모델을 기반으로 이미지와 관련된 질문 벡터에 대하여 정답을 추론하는 정답 추론부; 및상기 적어도 하나의 영역 맵을 이용하여 상기 정답을 추론하기 위한 설명 가능한 질문에 응답하는 정답 설명부를 포함하며,상기 설명 가능한 질문은 (i) 상기 정답이 상기 이미지에서 어디에 위치하는지에 관한 제1 질문, (ii) 상기 정답이 추론되는 과정에서 선택된 영역들 및 상기 영역들이 선택된 순서에 관한 제2 질문, (iii) 상기 이미지에서 상기 정답이 아닌 객체 영역이 상기 정답에 해당하지 않는 이유에 관한 제3 질문, 또는 이들의 조합에 관한 것을 특징으로 하는 시각 질의 응답 장치
10 10
제9항에 있어서,상기 정답 추론 모델은 N(상기 N은 자연수) 개의 레이어를 포함하며, N-K (상기 K는 상기 N보다 작은 자연수)번째의 레이어 내지 N 번째의 레이어에 각각 대응하는 시각 특징을 추출하고 상기 N-K 번째의 레이어 내지 상기 N 번째의 레이어에 각각 대응하는 시각 특징 및 상기 질문 벡터를 기반으로 학습하여, 상기 이미지를 복수의 조각으로 분할하고 상기 N-K 번째의 레이어 내지 상기 N 번째의 레이어에 각각 대응하도록 상기 정답을 추론하는 데 필요한 영역을 예측하기 위한 K 개의 영역 맵을 생성하는 것을 특징으로 하는 시각 질의 응답 장치
11 11
삭제
12 12
제9항에 있어서,상기 정답 설명부는,상기 제1 질문에 대하여 상기 복수의 레이어 중에서 최종 레이어에 대응하는 시각 특징에 상기 영역 맵을 반영하여 상기 이미지에서 상기 정답의 위치를 표시하는 것을 특징으로 하는 시각 질의 응답 장치
13 13
제9항에 있어서,상기 정답 설명부는,상기 제2 질문에 대하여 상기 복수의 레이어 중에서 일부 레이어에 대응하는 복수의 시각 특징에 복수의 영역 맵을 각각 반영한 영역 특징들을 상기 이미지에서 순서대로 표시하는 것을 특징으로 하는 시각 질의 응답 장치
14 14
제9항에 있어서,상기 정답 설명부는,상기 제3 질문에 대하여 상기 복수의 레이어 중에서 일부 레이어에 대응하는 복수의 시각 특징에 복수의 영역 맵을 각각 반영한 영역 특징들을 게이트 순환 유닛(Gated Recurrent Unit, GRU)에 입력하여 대답 문장을 생성하는 것을 특징으로 하는 시각 질의 응답 장치
15 15
프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 비일시적(Non-Transitory) 컴퓨터 판독 가능한 매체에 기록되어 시각 질의 응답을 위한 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램 명령어들이 컴퓨팅 디바이스의 적어도 하나의 프로세서에 의해 실행되는 경우에,정답 추론 모델의 복수의 레이어 사이에 적어도 하나의 영역 맵을 추가하고 상기 정답 추론 모델을 기반으로 이미지와 관련된 질문 벡터에 대하여 정답을 추론하는 단계; 및상기 적어도 하나의 영역 맵을 이용하여 상기 정답을 추론하기 위한 설명 가능한 질문에 응답하는 단계를 포함한 동작들을 수행하며,상기 설명 가능한 질문은 (i) 상기 정답이 상기 이미지에서 어디에 위치하는지에 관한 제1 질문, (ii) 상기 정답이 추론되는 과정에서 선택된 영역들 및 상기 영역들이 선택된 순서에 관한 제2 질문, (iii) 상기 이미지에서 상기 정답이 아닌 객체 영역이 상기 정답에 해당하지 않는 이유에 관한 제3 질문, 또는 이들의 조합에 관한 것을 특징으로 하는 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신기술진흥센터(NIPA산하)-인공지능국가전략프로젝트사업 [이지바로][주관:한국과학기술원]설명 가능한 인간 수준의 딥 기계학습 추론 프레임워크 개발(1/5)