맞춤기술찾기

이전대상기술

약지도 학습 기반의 동영상 구간 검색 방법 및 그 장치

  • 기술번호 : KST2023003521
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 적어도 하나의 프로세서에 의해 동작하는 동영상 구간 검색 장치의 동작 방법에 있어서, 문장 및 상기 문장이 묘사하는 프레임을 포함하는 동영상을 입력받아, 문장 특징 벡터 및 동영상 특징 벡터를 추출하는 단계, 그리고 상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 유사도를 기초로, 상기 문장과 관련된 적어도 하나의 프레임으로 구성된 동영상 후보 영역을 생성하는 단계를 포함한다.
Int. CL G06F 16/732 (2019.01.01) G06F 16/783 (2019.01.01) G06F 16/74 (2019.01.01) G06F 17/16 (2006.01.01) G06N 3/0895 (2023.01.01) G06V 10/40 (2022.01.01)
CPC G06F 16/7328(2013.01) G06F 16/7844(2013.01) G06F 16/7847(2013.01) G06F 16/74(2013.01) G06F 17/16(2013.01) G06N 3/0895(2013.01) G06V 10/40(2013.01)
출원번호/일자 1020220168698 (2022.12.06)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2023-0085103 (2023.06.13) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210172582   |   2021.12.06
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 유창동 대전광역시 유성구
2 윤선재 대전광역시 유성구
3 김다현 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 유미특허법인 대한민국 서울특별시 강남구 테헤란로 ***, 서림빌딩 **층 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.12.06 수리 (Accepted) 1-1-2022-1309930-25
2 특허고객번호 정보변경(경정)신고서·정정신고서
2023.01.31 수리 (Accepted) 4-1-2023-5023571-05
3 특허고객번호 정보변경(경정)신고서·정정신고서
2023.05.04 수리 (Accepted) 4-1-2023-5110236-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 하나의 프로세서에 의해 동작하는 동영상 구간 검색 장치의 동작 방법에 있어서,문장 및 상기 문장이 묘사하는 프레임을 포함하는 동영상을 입력받아, 문장 특징 벡터 및 동영상 특징 벡터를 추출하는 단계, 그리고상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 유사도를 기초로, 상기 문장과 관련된 적어도 하나의 프레임으로 구성된 동영상 후보 영역을 생성하는 단계를 포함하는, 동작 방법
2 2
제1항에서,상기 동영상 후보 영역을 생성하는 단계는,상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 유사도를 토대로, 문장과 동영상 프레임 간의 코사인 유사성을 나타낸 유사도 곡선을 생성하고, 상기 유사도 곡선을 적분한 유사도 적분 곡선(Similarity Integral Curve)을 생성하는 단계, 그리고상기 유사도 적분 곡선을 이용하여 상기 문장과 관련된 복수개의 동영상 후보 영역을 생성하는 단계를 포함하는, 동작 방법
3 3
제2항에서,상기 문장과 관련된 복수개의 동영상 후보 영역을 생성하는 단계 이후,상호 인접한 시간 영역에 위치하는 적어도 두개의 동영상 후보 영역을 결합하여 다양한 크기를 가진 멀티 스케일 동영상 후보 영역을 생성하는 단계를 더 포함하는, 동작 방법
4 4
제2항에서,상기 유사도 곡선은,상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 프레임-레벨 코사인 유사도를 이용하여 생성되는, 동작 방법
5 5
제4항에서,상기 프레임-레벨 코사인 유사도는, 상기 문장 특징 벡터의 에버리지 풀링(average pooling)을 대상으로 계산되는, 동작 방법
6 6
제1항에서,상기 검색하는 단계 이후,포지티브 동영상 구간에서 하드 네거티브 프레임을 결정하도록 학습된 대조군 학습이 수행된 동영상 검색 모델을 통해 상기 동영상 후보 영역의 포지티브 동영상 구간에서 상기 문장과와 관련된 문장 특징 벡터와의 코사인 유사도가 가장 높은 하나의 동영상 후보 영역을 결정하는 단계를 더 포함하는, 동작 방법
7 7
제6항에서,상기 동영상 검색 모델은,포지티브(Positive) 프레임들에서 가장 낮은 유사도를 가지는 후보 영역을 선택할 확률을 나타내는 제1 손실을 학습하는, 동작 방법
8 8
제7항에서,상기 동영상 검색 모델은,네거티브(Negative) 프레임들과 문장 특징 벡터를 이용하여 배치당 다른 동영상 들에서 네거티브 프레임을 선택할 확률을 나타내는 제2 손실을 추가로 학습하는, 동작 방법
9 9
제8항에서,상기 동영상 검색 모델은,상기 제1 손실과 상기 제2 손실을 합산한 총 손실을 학습하는, 동작 방법
10 10
입력 문장의 문장 특징 벡터를 추출하는 문장 특징 추출부,상기 입력 문장이 표현하는 장면을 포함하는 입력 동영상의 동영상 특징 벡터를 추출하는 동영상 특징 추출부,상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 유사도를 기초로, 상기 입력 동영상을 구성하는 복수의 프레임들 중에서 상기 문장과 관련된 적어도 하나의 프레임으로 구성된 동영상 후보 영역을 생성하는 후보 동영상 영역 생성부를 포함하는, 동영상 구간 검색 장치
11 11
제10항에서,상기 후보 동영상 영역 생성부는,상기 문장 특징 벡터와 상기 동영상 특징 벡터 간의 유사도를 토대로, 문장과 동영상 프레임 간의 코사인 유사성을 나타낸 유사도 곡선을 적분한 유사도 적분 곡선(Similarity Integral Curve)을 생성하고, 상기 유사도 적분 곡선을 이용하여 상기 문장과 관련된 복수개의 동영상 후보 영역을 생성하는, 동영상 구간 검색 장치
12 12
제11항에서,상기 후보 동영상 영역 생성부는,상호 인접한 시간 영역에 위치하는 적어도 두개의 동영상 후보 영역을 결합하여 다양한 크기를 가진 멀티 스케일 동영상 후보 영역을 생성하는, 동영상 구간 검색 장치
13 13
제10항에서,상기 동영상 특징 추출부는,상기 입력 동영상에 포함된 장면을 서술하는 복수의 자막을 입력받아 복수의 자막 특징 벡터를 추출하는 텍스트 인코더,상기 입력 동영상을 구성하는 복수의 프레임들의 복수의 프레임 특징 벡터를 추출하는 동영상 디코더, 그리고상기 복수의 자막 특징 벡터와 상기 복수의 프레임 특징 벡터를 결합한 동영상 특징 벡터를 추출하는 계층적 인코더를 포함하는, 동영상 구간 검색 장치
14 14
제13항에서,포지티브 동영상 구간에서 하드 네거티브 프레임을 결정하도록 학습된 대조군 학습을 수행하는 하드(Hard) 네거티브(Negative) 샘플링(Sampling)부를 더 포함하고,상기 대조군 학습은,포지티브 프레임들에서 가장 낮은 유사도를 가지는 후보 영역을 선택할 확률을 나타내는 제1 손실, 그리고 네거티브 프레임들과 문장 특징 벡터를 이용하여 배치당 다른 동영상 들에서 네거티브 프레임을 선택할 확률을 나타내는 제2 손실을 합산한 총 손실을 학습하는, 동영상 구간 검색 장치
15 15
제10항에서,상기 후보 동영상 영역 생성부는,상기 동영상 후보 영역의 포지티브(Positive) 동영상 구간에서 상기 입력 문장과 관련된 문장 특징 벡터와 코사인 유사도가 가장 높은 하나의 동영상 후보 영역을 검색 결과로 제공하는, 동영상 구간 검색 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 기술개발사업 (N01210806)(통합EZ)(SW 스타랩) 비디오 이해 및 강화학습을 통한 인과관계를 이해하는 인공지능 원천기술 개발 및 실 환경에서의 응용(2021년도)