기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

스토리 기반 이미지 시퀀스 결정 방법, 장치 및 시스템

기술번호 : KST2023002253
담당센터 : 서울동부기술혁신센터
전화번호 : 02-2155-3662

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 스토리 기반 이미지 시퀀스 결정 방법, 장치 및 이미지 시퀀스 결정 시스템에 관한 것으로, 더욱 상세하게는 텍스트를 문장의 문맥과 시각적 맥락을 고려하며 묘사하는 이미지를 선출하는 스토리 기반 이미지 시퀀스 결정 방법, 장치 및 이미지 시퀀스 결정 시스템에 관한 것이다.
Int. CL	G06F 16/583 (2019.01.01) G06F 16/532 (2019.01.01) G06F 16/55 (2019.01.01) G06F 16/2457 (2019.01.01) G06F 16/2453 (2019.01.01) G06F 40/284 (2020.01.01)
CPC	G06F 16/583(2013.01) G06F 16/532(2013.01) G06F 16/55(2013.01) G06F 16/24578(2013.01) G06F 16/24534(2013.01) G06F 40/284(2013.01)
출원번호/일자	1020220141376 (2022.10.28)
출원인	서울대학교산학협력단
등록번호/일자
공개번호/일자	10-2023-0062430 (2023.05.09) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보	대한민국 \| 1020210147034 \| 2021.10.29
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	서울대학교산학협력단	대한민국	서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	김건우		서울특별시 관악구
2	조시현		서울특별시 관악구
3	김성우		서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인 남앤남	대한민국	서울특별시 중구 서소문로*(서소문동, 정안빌딩층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2022.10.28	수리 (Accepted)	1-1-2022-1144853-37

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 인공지능 모델 기반 이미지 시퀀스 결정 장치에 의해 실행되는 스토리 기반 이미지 시퀀스 결정 방법에 있어서,스토리 인코더(Story encoder)를 이용하여, 텍스트 기반 스토리의 현재문장의 토큰 단위로 상기 스토리 상의 적어도 하나의 이전 문장과 상기 현재문장 간의 연관도에 기반하여 상기 현재문장을 인코딩하는 단계;인코딩된 상기 현재문장과 기 저장된 이미지 간 유사도를 기반으로 주어진 이미지 데이터베이스에서 상기 현재문장과 연관된 복수의 제1 후보 이미지를 검색하는 단계;이미지 간 씬 그래프(Scene Graph) 유사도를 기반으로 상기 이미지 데이터베이스에서 상기 현재문장의 직전문장의 최적 이미지와 연관된 복수의 제2 후보 이미지를 검색하는 단계; 및상기 복수의 제1 후보 이미지 및 상기 복수의 제2 후보 이미지에 기반하여 상기 현재문장의 최적 이미지를 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
2	2 제 1 항에 있어서,상기 현재문장을 인코딩하는 단계는,상기 현재문장의 각 토큰과 상기 적어도 하나의 이전 문장과의 어텐션(attention)을 계산하여 상기 현재문장의 토큰 단위로 상기 연관도를 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
3	3 제 1 항에 있어서,상기 제1 후보 이미지를 검색하는 단계는,상기 현재문장을 벡터화하여 잠재벡터를 생성하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 현재문장의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제1 후보 이미지를 선출하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
4	4 제 1 항에 있어서,상기 씬 그래프는,이미지에 포함된 적어도 하나의 객체의 종류를 꼭지점(vertex)으로, 상기 객체들 간 작용관계를 간선(edge)으로 갖는 자료 구조인,스토리 기반 이미지 시퀀스 결정 방법
5	5 제 1 항에 있어서,상기 복수의 제2 후보 이미지를 검색하는 단계는,상기 직전문장의 최적 이미지의 씬 그래프를 생성하고, 이를 그래프 신경망에 통과시켜 잠재벡터를 획득하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 직전문장의 최적 이미지의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제2 후보 이미지를 선출하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
6	6 제 3 항 및 제 5 항 중 어느 한 항에 있어서,상기 현재문장의 최적 이미지를 결정하는 단계는,상기 복수의 제1 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제1 후보 이미지에 대한 각 유사도를 산출하는 단계;상기 복수의 제2 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제2 후보 이미지에 대한 각 유사도를 산출하는 단계; 및상기 복수의 제1 후보 이미지에 대한 각 유사도 및 상기 복수의 제2 후보 이미지에 대한 각 유사도를 평균하여 가장 유사도가 높은 이미지를 상기 최적 이미지로 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
7	7 제 1 항에 있어서,상기 현재문장이 상기 텍스트 기반 스토리의 첫 문장인 경우,상기 첫 문장을 벡터화하여 잠재벡터를 생성하는 단계;상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 첫 문장의 잠재벡터를 코사인-유사도 기반으로 분석하는 단계; 및상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 가장 높은 이미지를 상기 최적 이미지로 결정하는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
8	8 제 1 항에 있어서,상기 현재문장의 최적 이미지를 결정하는 단계는,상기 현재문장이 상기 텍스트 기반 스토리의 마지막 문장이 될 때까지 순차적으로 각 문장에 대해 상기 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 방법
9	9 제 1 항에 있어서,상기 인공지능 모델을 학습시키는 단계를 더 포함하고,상기 인공지능 모델을 학습시키는 단계는,복수의 문장을 포함하는 텍스트 기반 스토리로 구성된 학습 데이터셋을 구비하는 단계;상기 복수의 문장을 상기 인공지능 모델에 입력시켜 복수의 최적 이미지를 획득하는 단계;상기 복수의 최적 이미지를 BiLSTM 및 디코더를 이용하여 텍스트 기반 스토리로 복원하는 단계;상기 복원된 스토리와 원본 스토리를 비교하여 산술적 차이를 계산하는 단계; 및상기 산술적 차이를 기반으로 상기 이미지 시퀀스 결정 모델을 역전파 방식으로 학습시키는 단계를 포함하는,스토리 기반 이미지 시퀀스 결정 방법
10	10 텍스트 기반 스토리를 수신하는 통신부;텍스트 기반 스토리를 묘사하는 이미지를 결정하도록 학습된 인공지능 모델을 저장하는 메모리; 및상기 메모리 및 통신부를 제어하는 프로세서를 포함하고,상기 프로세서는,스토리 인코더(Story encoder)를 이용하여, 텍스트 기반 스토리의 현재문장의 토큰 단위로 상기 스토리 상의 적어도 하나의 이전 문장과 상기 현재문장 간의 연관도에 기반하여 상기 현재문장을 인코딩하고,인코딩된 상기 현재문장과 기 저장된 이미지 간 유사도를 기반으로 주어진 이미지 데이터베이스에서 상기 현재문장과 연관된 복수의 제1 후보 이미지를 검색하며,이미지 간 씬 그래프(Scene Graph) 유사도를 기반으로 상기 이미지 데이터베이스에서 상기 현재문장의 직전문장의 최적 이미지와 연관된 복수의 제2 후보 이미지를 검색하고,상기 복수의 제1 후보 이미지 및 상기 복수의 제2 후보 이미지에 기반하여 상기 현재문장의 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 장치
11	11 제 10 항에 있어서,상기 프로세서는,상기 현재문장의 각 토큰과 상기 적어도 하나의 이전 문장과의 어텐션(attention)을 계산하여 상기 현재문장의 토큰 단위로 상기 연관도를 결정하는, 스토리 기반 이미지 시퀀스 결정 장치
12	12 제 10 항에 있어서,상기 프로세서는,상기 현재문장을 벡터화하여 잠재벡터를 생성하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 현재문장의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제1 후보 이미지를 선출하는,스토리 기반 이미지 시퀀스 결정 장치
13	13 제 10 항에 있어서,상기 씬 그래프는,이미지에 포함된 적어도 하나의 객체의 종류를 꼭지점(vertex)으로, 상기 객체들 간 작용관계를 간선(edge)으로 갖는 자료 구조인,스토리 기반 이미지 시퀀스 결정 장치
14	14 제 10 항에 있어서,상기 프로세서는,상기 직전문장의 최적 이미지의 씬 그래프를 생성하고, 이를 그래프 신경망에 통과시켜 잠재벡터를 획득하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 직전문장의 최적 이미지의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 높은 순으로 소정 개수의 상기 복수의 제2 후보 이미지를 선출하는,스토리 기반 이미지 시퀀스 결정 장치
15	15 제 13 항 및 제 15 항 중 어느 한 항에 있어서,상기 프로세서는,상기 복수의 제1 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제1 후보 이미지에 대한 각 유사도를 산출하고,상기 복수의 제2 후보 이미지의 잠재벡터들을 상기 직전문장의 최적 이미지의 잠재벡터와 유사 분석하여, 상기 복수의 제2 후보 이미지에 대한 각 유사도를 산출하며,상기 복수의 제1 후보 이미지에 대한 각 유사도 및 상기 복수의 제2 후보 이미지에 대한 각 유사도를 평균하여 가장 유사도가 높은 이미지를 상기 최적 이미지로 결정하는,스토리 기반 이미지 시퀀스 결정 장치
16	16 제 10 항에 있어서,상기 프로세서는,상기 현재문장이 상기 텍스트 기반 스토리의 첫 문장인 경우,상기 첫 문장을 벡터화하여 잠재벡터를 생성하고,상기 이미지 데이터베이스에 저장된 이미지들의 잠재벡터와 상기 첫 문장의 잠재벡터를 코사인-유사도 기반으로 분석하며,상기 이미지 데이터베이스에 저장된 이미지들 중 상기 분석의 결과에 따라 유사도가 가장 높은 이미지를 상기 최적 이미지로 결정하는,스토리 기반 이미지 시퀀스 결정 장치
17	17 제 10 항에 있어서,상기 프로세서는,상기 현재문장이 상기 텍스트 기반 스토리의 마지막 문장이 될 때까지 순차적으로 각 문장에 대해 상기 최적 이미지를 결정하는,스토리 기반 이미지 시퀀스 결정 장치
18	18 제 10 항에 있어서,상기 인공지능 모델을 학습시키는 학습부를 더 포함하고,상기 학습부는,복수의 문장을 포함하는 텍스트 기반 스토리로 구성된 학습 데이터셋을 구비하고, 상기 복수의 문장을 상기 인공지능 모델에 입력시켜 복수의 최적 이미지를 획득하며, 상기 복수의 최적 이미지를 BiLSTM 및 디코더를 이용하여 텍스트 기반 스토리로 복원하고, 상기 복원된 스토리와 원본 스토리를 비교하여 산술적 차이를 계산하여, 상기 산술적 차이를 기반으로 상기 이미지 시퀀스 결정 모델을 역전파 방식으로 학습시키는,스토리 기반 이미지 시퀀스 결정 장치
19	19 텍스트 기반의 복수의 문장으로 구성된 스토리를 전송하는 사용자 디바이스;학습된 이미지 시퀀스 결정 모델을 기반으로 상기 사용자 디바이스로부터 입력된 스토리의 현재문장과 이전 문장들의 문맥 연관성을 고려하고, 동시에 직전문장에 대응하여 선출된 최적 이미지와 시각적 맥락을 유지하면서, 현재문장을 의미상 가장 높은 유사도로 묘사하는 이미지를 선출하는 이미지 시퀀스 결정 서버; 및상기 이미지 시퀀스 결정 모델의 추론에 이용되는 이미지들 및 상기 이미지들마다 사전 정의된 씬 그래프를 매핑하여 저장하는 데이터베이스;를 포함하는,스토리 기반 이미지 시퀀스 결정 시스템

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	문화체육관광부	아트센터나비미술관	문화기술연구개발(R＆D)	휴머니스트를 위한 인공지능 : 화자-맞춤형 인공지능 기술 개발을 통한 융합콘텐츠 창제작 및 인력 양성

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2022.10.28	수리 (Accepted)	1-1-2022-1144853-37

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2023002055][서울대학교]	시민과학을 활용한 도심지역에 출몰하는 유해조수 퇴치지역 예측시스템 및 이를 이용한 예측방법	새창보기
[KST2020016554][서울대학교]	액티브 러닝을 위한 학습용 데이터 선정 방법, 액티브 러닝을 위한 학습용 데이터 선정 장치 및 액티브 러닝을 이용한 영상 분석 방법	새창보기
[KST2022020340][서울대학교]	문자열 검색 방법 및 장치	새창보기
[KST2022008549][서울대학교]	동의어 규칙을 이용한 문자열 매칭 방법 및 이를 구현하는 장치 및 프로그램	새창보기
[KST2022020533][서울대학교]	사용자 단말의 캐싱을 활용한 최적의 비공개적 회수 달성을 위한 통신 시스템 및 그의 동작 방법	새창보기
[KST2021012020][서울대학교]	이미지 검색을 위한 뉴럴 네트워크 장치 및 이의 동작 방법	새창보기
[KST2022016596][서울대학교]	입력 문장을 사건구조프레임이 주석된 문장으로 출력하는 자동 주석방법	새창보기
[KST2021013269][서울대학교]	역색인 구조를 이용하여 검색을 수행하는 하드웨어 가속기 및 이를 포함하는 검색 시스템	새창보기
[KST2023010631][서울대학교]	의미기반 텍스트 분석을 이용한 건설공사계약서 자동검토 방법 및 장치	새창보기
[KST2023008940][서울대학교]	교량점검보고서의 손상 메커니즘 추출 장치 및 방법	새창보기
[KST2022015859][서울대학교]	안구 관련 데이터베이스 구축 시스템 및 방법	새창보기
[KST2023002260][서울대학교]	멀티 모달 대화를 위한 언어 모델 학습 방법 및 장치	새창보기
[KST2024000050][서울대학교]	인간의 전략을 인공신경망에 적용한 문장형 대수 문제 풀이 방법 및 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택