맞춤기술찾기

이전대상기술

비전 트랜스포머 기반의 영상 특징 추출 장치 및 방법

  • 기술번호 : KST2023010600
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 개시는 비전 트랜스포머 기반 영상 특징 추출 방법에 대한 것으로, 입력 이미지를 패치 단위로 임베딩 한 후 전역적 어텐션을 통한 시각적 특징을 추출하는 발명에 대한 것이다. 본 개시의 일 실시예에 따른 비전 트랜스포머 기반 영상 특징 추출 장치는 데이터를 저장하는 메모리, 상기 메모리를 제어하는 프로세서를 포함하되, 상기 프로세서는, 입력 영상에 대해 다중 패치를 임베딩(embedding)하고, 상기 임베딩된 다중 패치에 대한 특징맵을 추출하고, 상기 추출된 특징맵을 이용하여 신경망 기반의 트랜스포머 인코딩을 수행하고, 상기 트랜스포머 인코딩을 통해 추출된 최종 특징맵을 통해 상기 입력 영상의 특징을 추출하되, 상기 패치는 서로 다른 크기를 가질 수 있다.
Int. CL G06V 10/40 (2022.01.01) G06V 10/46 (2022.01.01) G06N 3/04 (2023.01.01)
CPC G06V 10/40(2013.01) G06V 10/467(2013.01) G06N 3/045(2013.01)
출원번호/일자 1020220059497 (2022.05.16)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2023-0159998 (2023.11.23) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.05.16)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이영완 대전광역시 유성구
2 김종희 대전광역시 유성구
3 문진영 대전광역시 유성구
4 배강민 대전광역시 유성구
5 배유석 대전광역시 유성구
6 함제석 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인아주 대한민국 서울특별시 강남구 강남대로 ***, **,**층(역삼동, 동희빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.05.16 수리 (Accepted) 1-1-2022-0514879-13
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2022.10.29 수리 (Accepted) 1-1-2022-1147635-16
3 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2022.10.29 1-1-2022-1147600-18
4 [반환신청]서류 반려요청서·반환신청서
2022.10.29 수리 (Accepted) 1-1-2022-1147633-14
5 선행기술조사의뢰서
Request for Prior Art Search
2023.05.18 수리 (Accepted) 9-1-9999-9999999-89
6 선행기술조사보고서
Report of Prior Art Search
2023.07.18 발송처리완료 (Completion of Transmission) 9-6-2023-0133656-17
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
데이터를 저장하는 메모리;상기 메모리를 제어하는 프로세서;를 포함하되, 상기 프로세서는, 입력 영상에 대해 다중 패치를 임베딩(embedding)하고, 상기 임베딩된 다중 패치에 대한 특징맵을 추출하고,상기 추출된 특징맵을 이용하여 신경망 기반의 트랜스포머 인코딩을 수행하고,상기 트랜스포머 인코딩을 통해 추출된 최종 특징맵을 통해 상기 입력 영상의 특징을 추출하되,상기 패치는 서로 다른 크기를 갖는, 비전 트랜스포머 기반 영상 특징 추출 장치
2 2
제1 항에 있어서,상기 패치는 상기 서로 다른 크기로 병렬적으로 임베딩되는, 비전 트랜스포머 기반 영상 특징 추출 장치
3 3
제1 항에 있어서,상기 트랜스포머 인코딩은 상기 특징맵에 대해 병렬적으로 수행되는, 비전 트랜스포머 기반 영상 특징 추출 장치
4 4
제1 항에 있어서,상기 패치는 서로 영역이 겹치도록 임베딩되는, 비전 트랜스포머 기반 영상 특징 추출 장치
5 5
제1 항에 있어서,상기 트랜스포머 인코딩은 상기 다중 패치 간의 상관관계를 구함으로써 수행되는, 비전 트랜스포머 기반 영상 특징 추출 장치
6 6
제5 항에 있어서,상기 상관관계는 상기 다중 패치 간에 유사 영역 혹은 유사 카테고리를 포함하는지에 따라 정해지는, 비전 트랜스포머 기반 영상 특징 추출 장치
7 7
제6 항에 있어서,상기 상관관계는 상기 최종 특징맵을 추출하기 위해 상기 특징맵의 어텐션 맵(attention map)을 구하는데 이용되는, 비전 트랜스포머 기반 영상 특징 추출 장치
8 8
제7 항에 있어서,상기 상관관계는 키(key), 쿼리(query), 밸류(value)에 대한 임베딩을 통해 계산되는, 비전 트랜스포머 기반 영상 특징 추출 장치
9 9
제8 항에 있어서,상기 특징맵은 상기 밸류를 상기 어텐션 맵에 곱함으로써 추출되는, 비전 트랜스포머 기반 영상 특징 추출 장치
10 10
제9 항에 있어서, 상기 최종 특징맵은 상기 특징맵에 대한 부가 연산(concatenation) 및 컨볼루션(convolution) 연산을 통해 상기 특징맵 간의 상호 작용을 학습한 레이어를 기반으로 추출되는, 비전 트랜스포머 기반 영상 특징 추출 장치
11 11
입력 영상에 대해 다중 패치를 임베딩(embedding)하는 단계; 상기 임베딩된 다중 패치에 대한 특징맵을 추출하는 단계; 상기 추출된 특징맵을 이용하여 신경망 기반의 트랜스포머 인코딩을 수행하는 단계; 상기 트랜스포머 인코딩을 통해 추출된 최종 특징맵을 통해 상기 입력 영상의 특징을 추출하는 단계;를 포함하되,상기 패치는 서로 다른 크기를 갖는, 비전 트랜스포머 기반 영상 특징 추출 방법
12 12
제11 항에 있어서,상기 패치는 상기 서로 다른 크기로 병렬적으로 임베딩되는, 비전 트랜스포머 기반 영상 특징 추출 방법
13 13
제11 항에 있어서,상기 트랜스포머 인코딩은 상기 특징맵에 대해 병렬적으로 수행되는, 비전 트랜스포머 기반 영상 특징 추출 방법
14 14
제11 항에 있어서,상기 패치는 서로 영역이 겹치도록 임베딩되는, 비전 트랜스포머 기반 영상 특징 추출 방법
15 15
제11 항에 있어서,상기 트랜스포머 인코딩은 상기 다중 패치 간의 상관관계를 구함으로써 수행되는, 비전 트랜스포머 기반 영상 특징 추출 방법
16 16
제15 항에 있어서,상기 상관관계는 상기 다중 패치 간에 유사 영역 혹은 유사 카테고리를 포함하는지에 따라 정해지는, 비전 트랜스포머 기반 영상 특징 추출 방법
17 17
제16 항에 있어서,상기 상관관계는 상기 최종 특징맵을 추출하기 위해 상기 특징맵의 어텐션 맵(attention map)을 구하는데 이용되는, 비전 트랜스포머 기반 영상 특징 추출 방법
18 18
제17 항에 있어서,상기 상관관계는 키(key), 쿼리(query), 밸류(value)에 대한 임베딩을 통해 계산되는, 비전 트랜스포머 기반 영상 특징 추출 방법
19 19
제18 항에 있어서,상기 특징맵은 상기 밸류를 상기 어텐션 맵에 곱함으로써 추출되는, 비전 트랜스포머 기반 영상 특징 추출 방법
20 20
비전 트랜스포머 기반 영상 특징 추출을 위한 트랜스포머 인코딩 방법에 있어서,다중 패치로 임베딩된 특징맵을 기반으로 정규화(normalize)를 수행하는 단계;상기 다중 패치 간 상관관계를 계산하여 셀프 어텐션(self-attention) 연산을 수행하는 단계;상기 셀프 어텐션 연산에 의해 생성된 어텐션맵을 이용하여, 상기 상관관계를 기반으로 최종 특징맵을 생성하는 단계;를 포함하되, 상기 패치는 서로 다른 크기를 갖고, 상기 상관관계는 키(key), 쿼리(query), 밸류(value) 임베딩을 기반으로 도출되는, 트랜스포머 인코딩 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 ETRI ETRI연구개발지원사업 장기 시각 메모리 네트워크 기반의 예지형 시각지능 핵심기술 개발
2 과학기술정보통신부 ETRI 2019년 RnD 재발견프로젝트 (딥뷰-1세부) 실시간 대규모 영상 데이터 이해·예측을 위한 고성능 비주얼 디스커버리 플랫폼 개발