맞춤기술찾기

이전대상기술

스토리 기반 이미지 시퀀스 결정 방법, 장치 및 시스템

  • 기술번호 : KST2023002253
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 스토리 기반 이미지 시퀀스 결정 방법, 장치 및 이미지 시퀀스 결정 시스템에 관한 것으로, 더욱 상세하게는 텍스트를 문장의 문맥과 시각적 맥락을 고려하며 묘사하는 이미지를 선출하는 스토리 기반 이미지 시퀀스 결정 방법, 장치 및 이미지 시퀀스 결정 시스템에 관한 것이다.
Int. CL G06F 16/583 (2019.01.01) G06F 16/532 (2019.01.01) G06F 16/55 (2019.01.01) G06F 16/2457 (2019.01.01) G06F 16/2453 (2019.01.01) G06F 40/284 (2020.01.01)
CPC G06F 16/583(2013.01) G06F 16/532(2013.01) G06F 16/55(2013.01) G06F 16/24578(2013.01) G06F 16/24534(2013.01) G06F 40/284(2013.01)
출원번호/일자 1020220141376 (2022.10.28)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2023-0062430 (2023.05.09) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210147034   |   2021.10.29
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김건우 서울특별시 관악구
2 조시현 서울특별시 관악구
3 김성우 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 남앤남 대한민국 서울특별시 중구 서소문로**(서소문동, 정안빌딩*층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.10.28 수리 (Accepted) 1-1-2022-1144853-37
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
인공지능 모델 기반 이미지 시퀀스 결정 장치에 의해 실행되는 스토리 기반 이미지 시퀀스 결정 방법에 있어서,스토리 인코더(Story encoder)를 이용하여, 텍스트 기반 스토리의 현재문장의 토큰 단위로 상기 스토리 상의 적어도 하나의 이전 문장과 상기 현재문장 간의 연관도에 기반하여 상기 현재문장을 인코딩하는 단계;인코딩된 상기 현재문장과 기 저장된 이미지 간 유사도를 기반으로 주어진 이미지 데이터베이스에서 상기 현재문장과 연관된 복수의 제1 후보 이미지를 검색하는 단계;이미지 간 씬 그래프(Scene Graph) 유사도를 기반으로 상기 이미지 데이터베이스에서 상기 현재문장의 직전문장의 최적 이미지와 연관된 복수의 제2 후보 이미지를 검색하는 단계; 및상기 복수의 제1 후보 이미지 및 상기 복수의 제2 후보 이미지에 기반하여 상기 현재문장의 최적 이미지를 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
2 2
제 1 항에 있어서,상기 현재문장을 인코딩하는 단계는,상기 현재문장의 각 토큰과 상기 적어도 하나의 이전 문장과의 어텐션(attention)을 계산하여 상기 현재문장의 토큰 단위로 상기 연관도를 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
3 3
제 1 항에 있어서,상기 제1 후보 이미지를 검색하는 단계는,상기 현재문장을 벡터화하여 잠재벡터를 생성하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 현재문장의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제1 후보 이미지를 선출하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
4 4
제 1 항에 있어서,상기 씬 그래프는,이미지에 포함된 적어도 하나의 객체의 종류를 꼭지점(vertex)으로, 상기 객체들 간 작용관계를 간선(edge)으로 갖는 자료 구조인,스토리 기반 이미지 시퀀스 결정 방법
5 5
제 1 항에 있어서,상기 복수의 제2 후보 이미지를 검색하는 단계는,상기 직전문장의 최적 이미지의 씬 그래프를 생성하고, 이를 그래프 신경망에 통과시켜 잠재벡터를 획득하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 직전문장의 최적 이미지의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제2 후보 이미지를 선출하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
6 6
제 3 항 및 제 5 항 중 어느 한 항에 있어서,상기 현재문장의 최적 이미지를 결정하는 단계는,상기 복수의 제1 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제1 후보 이미지에 대한 각 유사도를 산출하는 단계;상기 복수의 제2 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제2 후보 이미지에 대한 각 유사도를 산출하는 단계; 및상기 복수의 제1 후보 이미지에 대한 각 유사도 및 상기 복수의 제2 후보 이미지에 대한 각 유사도를 평균하여 가장 유사도가 높은 이미지를 상기 최적 이미지로 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
7 7
제 1 항에 있어서,상기 현재문장이 상기 텍스트 기반 스토리의 첫 문장인 경우,상기 첫 문장을 벡터화하여 잠재벡터를 생성하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 첫 문장의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 가장 높은 이미지를 상기 최적 이미지로 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
8 8
제 1 항에 있어서,상기 현재문장의 최적 이미지를 결정하는 단계는,상기 현재문장이 상기 텍스트 기반 스토리의 마지막 문장이 될 때까지 순차적으로 각 문장에 대해 상기 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 방법
9 9
제 1 항에 있어서,상기 인공지능 모델을 학습시키는 단계를 더 포함하고,상기 인공지능 모델을 학습시키는 단계는,복수의 문장을 포함하는 텍스트 기반 스토리로 구성된 학습 데이터셋을 구비하는 단계;상기 복수의 문장을 상기 인공지능 모델에 입력시켜 복수의 최적 이미지를 획득하는 단계;상기 복수의 최적 이미지를 BiLSTM 및 디코더를 이용하여 텍스트 기반 스토리로 복원하는 단계;상기 복원된 스토리와 원본 스토리를 비교하여 산술적 차이를 계산하는 단계; 및상기 산술적 차이를 기반으로 상기 이미지 시퀀스 결정 모델을 역전파 방식으로 학습시키는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
10 10
텍스트 기반 스토리를 수신하는 통신부;텍스트 기반 스토리를 묘사하는 이미지를 결정하도록 학습된 인공지능 모델을 저장하는 메모리; 및상기 메모리 및 통신부를 제어하는 프로세서를 포함하고,상기 프로세서는,스토리 인코더(Story encoder)를 이용하여, 텍스트 기반 스토리의 현재문장의 토큰 단위로 상기 스토리 상의 적어도 하나의 이전 문장과 상기 현재문장 간의 연관도에 기반하여 상기 현재문장을 인코딩하고,인코딩된 상기 현재문장과 기 저장된 이미지 간 유사도를 기반으로 주어진 이미지 데이터베이스에서 상기 현재문장과 연관된 복수의 제1 후보 이미지를 검색하며,이미지 간 씬 그래프(Scene Graph) 유사도를 기반으로 상기 이미지 데이터베이스에서 상기 현재문장의 직전문장의 최적 이미지와 연관된 복수의 제2 후보 이미지를 검색하고,상기 복수의 제1 후보 이미지 및 상기 복수의 제2 후보 이미지에 기반하여 상기 현재문장의 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 장치
11 11
제 10 항에 있어서,상기 프로세서는,상기 현재문장의 각 토큰과 상기 적어도 하나의 이전 문장과의 어텐션(attention)을 계산하여 상기 현재문장의 토큰 단위로 상기 연관도를 결정하는, 스토리 기반 이미지 시퀀스 결정 장치
12 12
제 10 항에 있어서,상기 프로세서는,상기 현재문장을 벡터화하여 잠재벡터를 생성하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 현재문장의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제1 후보 이미지를 선출하는,스토리 기반 이미지 시퀀스 결정 장치
13 13
제 10 항에 있어서,상기 씬 그래프는,이미지에 포함된 적어도 하나의 객체의 종류를 꼭지점(vertex)으로, 상기 객체들 간 작용관계를 간선(edge)으로 갖는 자료 구조인,스토리 기반 이미지 시퀀스 결정 장치
14 14
제 10 항에 있어서,상기 프로세서는,상기 직전문장의 최적 이미지의 씬 그래프를 생성하고, 이를 그래프 신경망에 통과시켜 잠재벡터를 획득하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 직전문장의 최적 이미지의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제2 후보 이미지를 선출하는,스토리 기반 이미지 시퀀스 결정 장치
15 15
제 13 항 및 제 15 항 중 어느 한 항에 있어서,상기 프로세서는,상기 복수의 제1 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제1 후보 이미지에 대한 각 유사도를 산출하고,상기 복수의 제2 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제2 후보 이미지에 대한 각 유사도를 산출하며,상기 복수의 제1 후보 이미지에 대한 각 유사도 및 상기 복수의 제2 후보 이미지에 대한 각 유사도를 평균하여 가장 유사도가 높은 이미지를 상기 최적 이미지로 결정하는,스토리 기반 이미지 시퀀스 결정 장치
16 16
제 10 항에 있어서,상기 프로세서는,상기 현재문장이 상기 텍스트 기반 스토리의 첫 문장인 경우,상기 첫 문장을 벡터화하여 잠재벡터를 생성하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 첫 문장의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 가장 높은 이미지를 상기 최적 이미지로 결정하는,스토리 기반 이미지 시퀀스 결정 장치
17 17
제 10 항에 있어서,상기 프로세서는,상기 현재문장이 상기 텍스트 기반 스토리의 마지막 문장이 될 때까지 순차적으로 각 문장에 대해 상기 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 장치
18 18
제 10 항에 있어서,상기 인공지능 모델을 학습시키는 학습부를 더 포함하고,상기 학습부는,복수의 문장을 포함하는 텍스트 기반 스토리로 구성된 학습 데이터셋을 구비하고, 상기 복수의 문장을 상기 인공지능 모델에 입력시켜 복수의 최적 이미지를 획득하며, 상기 복수의 최적 이미지를 BiLSTM 및 디코더를 이용하여 텍스트 기반 스토리로 복원하고, 상기 복원된 스토리와 원본 스토리를 비교하여 산술적 차이를 계산하여, 상기 산술적 차이를 기반으로 상기 이미지 시퀀스 결정 모델을 역전파 방식으로 학습시키는,스토리 기반 이미지 시퀀스 결정 장치
19 19
텍스트 기반의 복수의 문장으로 구성된 스토리를 전송하는 사용자 디바이스;학습된 이미지 시퀀스 결정 모델을 기반으로 상기 사용자 디바이스로부터 입력된 스토리의 현재문장과 이전 문장들의 문맥 연관성을 고려하고, 동시에 직전문장에 대응하여 선출된 최적 이미지와 시각적 맥락을 유지하면서, 현재문장을 의미상 가장 높은 유사도로 묘사하는 이미지를 선출하는 이미지 시퀀스 결정 서버; 및상기 이미지 시퀀스 결정 모델의 추론에 이용되는 이미지들 및 상기 이미지들마다 사전 정의된 씬 그래프를 매핑하여 저장하는 데이터베이스;를 포함하는,스토리 기반 이미지 시퀀스 결정 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 문화체육관광부 아트센터나비미술관 문화기술연구개발(R&D) 휴머니스트를 위한 인공지능 : 화자-맞춤형 인공지능 기술 개발을 통한 융합콘텐츠 창제작 및 인력 양성