맞춤기술찾기

이전대상기술

뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기 및 그에 의한 분류 방법

  • 기술번호 : KST2023008841
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기에 관한 것으로서, 보다 구체적으로는 뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기(ViT-NeT)로서, 입력 이미지에서 주의 맵(attention map) 특징을 추출하는 계층적 변환기 인코더(hierarchical transformer encoder); 및 리프 노드를 포함하는 복수의 노드 및 상위 노드와 자식 노드 사이의 에지를 포함하여 구성되고, 완전 이진 트리 구조를 가지는 뉴럴 트리 디코더(neural tree decoder)를 포함하며, 상기 뉴럴 트리 디코더는, 상기 계층적 변환기 인코더에서 추출한 상기 주의 맵 특징을 입력으로 하여 최종 클래스 레이블을 예측하는 것을 그 구성상의 특징으로 한다. 본 발명은 뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기에 의한 분류 방법에 관한 것으로서, 보다 구체적으로는 컴퓨터로 구현되는 뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기(ViT-NeT)에 의해 수행되는 분류 방법으로서, (1) 입력 이미지에서 주의 맵(attention map) 특징을 추출하는 계층적 변환기 인코더(hierarchical transformer encoder); 및 리프 노드를 포함하는 복수의 노드 및 상위 노드와 자식 노드 사이의 에지를 포함하여 구성되고, 완전 이진 트리 구조를 가지는 뉴럴 트리 디코더(neural tree decoder)를 포함하여 구성되는 ViT-NeT를 학습해 분류 모델을 생성하는 단계; 및 (2) 상기 분류 모델에 입력 이미지를 입력해 최종 클래스 레이블을 예측하는 단계를 포함하며, 상기 뉴럴 트리 디코더는, 상기 계층적 변환기 인코더에서 추출한 상기 주의 맵 특징을 입력으로 하여 최종 클래스 레이블을 예측하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 뉴럴 트리 디코더를 이용한 해석 가능한 비전 변환기 및 그에 의한 분류 방법에 따르면, 비전 변환기(ViT) 인코더와 뉴럴 트리(NeT) 디코더를 결합해 ViT-NeT를 구성하되, 비전 변환기를 백본으로 사용해 주의 맵을 추출하고 이를 뉴럴 트리 디코더에 입력함으로써, 클래스 간 상관관계가 높고 클래스 내 상관관계가 낮은 세분화된 개체를 정확하게 분류할 수 있고, 트리 구조와 프로토타입을 통해 의사결정 과정을 설명하고 결과를 시각적으로 해석할 수 있어, 기존 앙상블 모델에서 발생하는 해석 가능성과 성능의 트레이드 오프를 해결할 수 있다.
Int. CL G06N 5/04 (2023.01.01) G06N 3/04 (2023.01.01) G06N 5/00 (2023.01.01)
CPC G06N 5/045(2013.01) G06N 3/045(2013.01) G06N 5/01(2013.01)
출원번호/일자 1020220039250 (2022.03.30)
출원인 계명대학교 산학협력단
등록번호/일자
공개번호/일자 10-2023-0140681 (2023.10.10) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.03.30)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 계명대학교 산학협력단 대한민국 대구광역시 달서구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고병철 대구광역시 수성구
2 김상원 대구광역시 달서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울 강서구 마곡중앙*로 ** *층 D**호(마곡동, 한일노벨리아타워)(특허그룹덕원)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.03.30 수리 (Accepted) 1-1-2022-0340274-20
2 선행기술조사의뢰서
Request for Prior Art Search
2023.08.18 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기(ViT-NeT)로서,입력 이미지에서 주의 맵(attention map) 특징을 추출하는 계층적 변환기 인코더(hierarchical transformer encoder)(100); 및리프 노드를 포함하는 복수의 노드 및 상위 노드와 자식 노드 사이의 에지를 포함하여 구성되고, 완전 이진 트리 구조를 가지는 뉴럴 트리 디코더(neural tree decoder)(200)를 포함하며,상기 뉴럴 트리 디코더(200)는,상기 계층적 변환기 인코더(100)에서 추출한 상기 주의 맵 특징을 입력으로 하여 최종 클래스 레이블을 예측하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
2 2
제1항에 있어서, 상기 계층적 변환기 인코더(100)는,시프트 윈도우(shifted window)를 사용해 윈도우 크기를 변경하여, 입력 이미지 내의 크기가 서로 다른 객체를 검출할 수 있는 주의 맵 특징을 추출하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
3 3
제2항에 있어서, 상기 계층적 변환기 인코더(100)는,스윈 변환기(swin transformer)를 백본 모델로 사용해 세밀한 분류와 이미지의 시각적 설명을 위한 상기 주의 맵 지도를 추출하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
4 4
제1항에 있어서, 상기 뉴럴 트리 디코더(200)는,프로토타입을 사용해 이미지 패치 중 차별적(discriminative) 특징을 찾아 경로설정 방향을 결정하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
5 5
제4항에 있어서, 상기 뉴럴 트리 디코더(200)는,각 노드에서 프로토타입과 이미지 패치 사이의 유사도(similarity)를 나타내는 라우팅 점수를 계산하고, 상기 라우팅 점수에 따라 경로설정 방향을 결정하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
6 6
제1항에 있어서, 상기 뉴럴 트리 디코더(200)의 에지는,맥락 변환기 모듈을 이용해 각 위치의 이미지 패치에 전역 맥락(global context)을 집약하여 전역 특징이 강화된 이미지 패치를 자식 노드에 공급하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
7 7
제5항에 있어서, 상기 뉴럴 트리 디코더(200)의 리프 노드는,클래스 확률을 예측하는 리프 예측 모듈에 의한 모든 리프 예측과 루트 노드에서 리프 노드까지의 경로별 에지 세트에 대한 누적 라우팅 점수를 이용해 최종 예측을 출력하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
8 8
제1항에 있어서, 상기 뉴럴 트리 디코더(200)는,데이터셋의 복잡성에 따라 트리 깊이가 결정되는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기
9 9
컴퓨터로 구현되는 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기(ViT-NeT)에 의해 수행되는 분류 방법으로서,(1) 입력 이미지에서 주의 맵(attention map) 특징을 추출하는 계층적 변환기 인코더(hierarchical transformer encoder)(100); 및 리프 노드를 포함하는 복수의 노드 및 상위 노드와 자식 노드 사이의 에지를 포함하여 구성되고, 완전 이진 트리 구조를 가지는 뉴럴 트리 디코더(neural tree decoder)(200)를 포함하여 구성되는 ViT-NeT를 학습해 분류 모델을 생성하는 단계; 및(2) 상기 분류 모델에 입력 이미지를 입력해 최종 클래스 레이블을 예측하는 단계를 포함하며,상기 뉴럴 트리 디코더(200)는,상기 계층적 변환기 인코더(100)에서 추출한 상기 주의 맵 특징을 입력으로 하여 최종 클래스 레이블을 예측하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
10 10
제9항에 있어서, 상기 계층적 변환기 인코더(100)는,시프트 윈도우(shifted window)를 사용해 윈도우 크기를 변경하여, 입력 이미지 내의 크기가 서로 다른 객체를 검출할 수 있는 주의 맵 특징을 추출하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
11 11
제10항에 있어서, 상기 계층적 변환기 인코더(100)는,스윈 변환기(swin transformer)를 백본 모델로 사용해 세밀한 분류와 이미지의 시각적 설명을 위한 상기 주의 맵 지도를 추출하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
12 12
제9항에 있어서, 상기 뉴럴 트리 디코더(200)는,프로토타입을 사용해 이미지 패치 중 차별적(discriminative) 특징을 찾아 경로설정 방향을 결정하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
13 13
제12항에 있어서, 상기 뉴럴 트리 디코더(200)는,각 노드에서 프로토타입과 이미지 패치 사이의 유사도(similarity)를 나타내는 라우팅 점수를 계산하고, 상기 라우팅 점수에 따라 경로설정 방향을 결정하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
14 14
제9항에 있어서, 상기 뉴럴 트리 디코더(200)의 에지는,맥락 변환기 모듈을 이용해 각 위치의 이미지 패치에 전역 맥락(global context)을 집약하여 전역 특징이 강화된 이미지 패치를 자식 노드에 공급하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
15 15
제13항에 있어서, 상기 뉴럴 트리 디코더(200)의 리프 노드는,클래스 확률을 예측하는 리프 예측 모듈에 의한 모든 리프 예측과 루트 노드에서 리프 노드까지의 경로별 에지 세트에 대한 누적 라우팅 점수를 이용해 최종 예측을 출력하는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
16 16
제9항에 있어서, 상기 뉴럴 트리 디코더(200)는,데이터셋의 복잡성에 따라 트리 깊이가 결정되는 것을 특징으로 하는, 뉴럴 트리 디코더(200)를 이용한 해석 가능한 비전 변환기에 의한 분류 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 계명대학교 박사과정생연구장려금지원 전방향 설명이 가능한 의사결정 신경망 구조 설계