맞춤기술찾기

이전대상기술

멀티모달 인공지능 에이전트를 이용하여 강화학습을 수행하는 방법 및 이를 수행하기 위한 컴퓨팅 장치

  • 기술번호 : KST2023001971
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 멀티모달 인공지능 에이전트를 이용하여 강화학습을 수행하는 방법은, 가상환경을 촬영한 영상에 포함된 프레임들을 복수의 구간들로 분할하는 단계 및 상기 분할된 복수의 구간별로 복수의 지도 방식(guidance type) 중 어느 하나를 적용하여, 멀티모달 인공지능 에이전트가 상기 영상을 통해 상기 가상환경과 상호작용하도록 함으로써 강화학습을 수행하는 단계를 포함하며, 상기 복수의 지도 방식은 지도 수준에 따라 3단계 이상으로 구분되며, 상기 강화학습을 수행하는 단계는, 상기 분할된 복수의 구간들 중 미리 설정된 결정적 시기(critical periods)의 구간들에 대해서는 중간 수준의 지도 방식을 적용하고, 나머지 구간들에 대해서는 상기 복수의 지도방식 중 어느 하나를 적용하여 강화학습을 수행하는 것을 특징으로 한다.
Int. CL G06N 3/00 (2022.01.01) G06N 3/08 (2023.01.01) H04N 13/239 (2018.01.01)
CPC G06N 3/008(2013.01) G06N 3/084(2013.01) H04N 13/239(2013.01)
출원번호/일자 1020210172384 (2021.12.03)
출원인 서울대학교산학협력단
등록번호/일자 10-2560188-0000 (2023.07.24)
공개번호/일자 10-2023-0083924 (2023.06.12) 문서열기
공고번호/일자 (20230726) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.12.03)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장병탁 서울특별시 관악구
2 오현석 서울특별시 관악구
3 박관영 경기도 부천시
4 이영기 서울특별시 관악구
5 이민수 경기도 성남시 분당구
6 이민후 대한민국 ***** 경기도 용인
7 이강훈 서울특별시 관악구
8 박준석 서울특별시 관악구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 아이스퀘어 대한민국 서울특별시 강남구 선릉로***,**층 ***호(대치동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.12.03 수리 (Accepted) 1-1-2021-1407089-73
2 [공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서
[Document Verifying Exclusion from Being Publically Known (Novelty, Special Provisions for Application)] Submission of Document
2021.12.06 수리 (Accepted) 1-1-2021-1412440-14
3 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.12.23 수리 (Accepted) 1-1-2021-1493461-05
4 특허고객번호 정보변경(경정)신고서·정정신고서
2022.04.04 수리 (Accepted) 4-1-2022-5079741-71
5 특허고객번호 정보변경(경정)신고서·정정신고서
2022.08.11 수리 (Accepted) 4-1-2022-5189083-38
6 특허고객번호 정보변경(경정)신고서·정정신고서
2022.10.07 수리 (Accepted) 4-1-2022-5235636-01
7 [우선심사신청]심사청구서·우선심사신청서
2023.03.21 수리 (Accepted) 1-1-2023-0317615-02
8 선행기술조사의뢰서
Request for Prior Art Search
2023.04.03 수리 (Accepted) 9-1-9999-9999999-89
9 선행기술조사보고서
Report of Prior Art Search
2023.04.24 발송처리완료 (Completion of Transmission) 9-6-2023-0081218-80
10 의견제출통지서
Notification of reason for refusal
2023.04.30 발송처리완료 (Completion of Transmission) 9-5-2023-0397513-43
11 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.05.09 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0515111-92
12 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.05.09 수리 (Accepted) 1-1-2023-0515110-46
13 등록결정서
Decision to grant
2023.07.17 발송처리완료 (Completion of Transmission) 9-5-2023-0649945-42
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
멀티모달 인공지능 에이전트를 이용하여 강화학습을 수행하는 방법에 있어서,가상환경을 촬영한 영상에 포함된 프레임들을 복수의 구간들로 분할하는 단계; 및상기 분할된 복수의 구간별로 복수의 지도 방식(guidance type) 중 어느 하나를 적용하여, 멀티모달 인공지능 에이전트가 상기 영상을 통해 상기 가상환경과 상호작용하도록 함으로써 강화학습을 수행하는 단계를 포함하며,상기 복수의 지도 방식은 지도 수준에 따라 3단계 이상으로 구분되며,상기 강화학습을 수행하는 단계는,상기 분할된 복수의 구간들 중 미리 설정된 결정적 시기(critical periods)의 구간들에 대해서는 중간 수준의 지도 방식을 적용하고, 나머지 구간들에 대해서는 상기 복수의 지도 방식 중 어느 하나를 적용하여 강화학습을 수행하는 것을 특징으로 하는, 방법
2 2
제1항에 있어서,훈련 대상이 되는 영상은 상기 가상환경에서 하나 이상의 객체를 촬영한 영상이며, 양안시(binocular vision)를 고려한 이미지 및 3D 공간 음향(3D spatialized audio)을 포함하는 것을 특징으로 하는 방법
3 3
제2항에 있어서,상기 강화학습을 수행하는 단계는,상기 양안시를 고려한 이미지를 콘볼루션 신경망을 이용해 처리한 후, 제1 다층 퍼셉트론을 통과시킨 출력과, 상기 3D 공간 음향을 양쪽 귀에서 수신한다고 가정하여 벡터화한 후, 제2 다층 퍼셉트론을 통과시킨 출력을 상호작용 특징 맵(interaction feature map)으로 통합하는 단계; 및객체 찾기 쿼리(object finding query)를 선형 사영(linear projection)한 결과에 상기 상호작용 특징 맵에 기초한 마스킹(masking)을 수행한 후, 제3 다층 퍼셉트론에 통과시키는 단계를 포함하는 것을 특징으로 하는 방법
4 4
제1항에 있어서,상기 멀티모달 인공지능 에이전트에는,양안시(binocular vision), 3D 공간화 오디오(3D spatialized audio) 입력, 메시 기반 촉각 센서(mesh-based tactile), 관절 수준의 물리(joint-level physics), 객체와의 상호작용(objective interaction) 및 현실적인 충돌(realistic collider) 특성이 탑재된 것을 특징으로 하는 방법
5 5
컴퓨터에 제1항에 기재된 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
6 6
컴퓨팅 장치에 의해 수행되며, 제1항에 기재된 방법을 수행하기 위해 컴퓨터 판독 가능 기록 매체에 저장된 컴퓨터 프로그램
7 7
멀티모달 인공지능 에이전트를 이용하여 강화학습을 수행하기 위한 컴퓨팅 장치에 있어서,데이터를 입력 받고, 이를 연산 처리한 결과를 출력하기 위한 입출력부;멀티모달 인공지능 에이전트를 이용한 강화학습을 수행하기 위한 프로그램 및 데이터가 저장되는 저장부; 및적어도 하나의 프로세서를 포함하며, 상기 프로그램을 실행시킴으로써 상기 강화학습을 수행하는 제어부를 포함하며,상기 제어부는 상기 프로그램을 실행함으로써,가상환경을 촬영한 영상에 포함된 프레임들을 복수의 구간들로 분할하고, 상기 분할된 복수의 구간별로 복수의 지도 방식(guidance type) 중 어느 하나를 적용하여, 멀티모달 인공지능 에이전트가 상기 영상을 통해 상기 가상환경과 상호작용하도록 함으로써 강화학습을 수행하며,상기 복수의 지도 방식은 지도 수준에 따라 3단계 이상으로 구분되고,상기 제어부는 상기 강화학습을 수행함에 있어서,상기 분할된 복수의 구간들 중 미리 설정된 결정적 시기(critical periods)의 구간들에 대해서는 중간 수준의 지도 방식을 적용하고, 나머지 구간들에 대해서는 상기 복수의 지도방식 중 어느 하나를 적용하여 강화학습을 수행하는 것을 특징으로 하는, 컴퓨팅 장치
8 8
제7항에 있어서,훈련 대상이 되는 영상은 상기 가상환경에서 하나 이상의 객체를 촬영한 영상이며, 양안시(binocular vision)를 고려한 이미지 및 3D 공간 음향(3D spatialized audio)을 포함하는 것을 특징으로 하는 컴퓨팅 장치
9 9
제8항에 있어서,상기 제어부는 상기 강화학습을 수행함에 있어서,상기 양안시를 고려한 이미지를 콘볼루션 신경망을 이용해 처리한 후, 제1 다층 퍼셉트론을 통과시킨 출력과, 상기 3D 공간 음향을 양쪽 귀에서 수신한다고 가정하여 벡터화한 후, 제2 다층 퍼셉트론을 통과시킨 출력을 상호작용 특징 맵(interaction feature map)으로 통합하고,객체 찾기 쿼리(object finding query)를 선형 사영(linear projection)한 결과에 상기 상호작용 특징 맵에 기초한 마스킹(masking)을 수행한 후, 제3 다층 퍼셉트론에 통과시키는 것을 특징으로 하는 컴퓨팅 장치
10 10
제7항에 있어서,상기 제어부는,상기 멀티모달 인공지능 에이전트에, 양안시(binocular vision), 3D 공간화 오디오(3D spatialized audio) 입력, 메시 기반 촉각 센서(mesh-based tactile), 관절 수준의 물리(joint-level physics), 객체와의 상호작용(objective interaction) 및 현실적인 충돌(realistic collider) 특성을 탑재하는 것을 특징으로 하는 컴퓨팅 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20230177820 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2023177820 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서울대학교 산학협력단 혁신성장동력프로젝트(R&D)(과기정통부) 비디오 튜링 테스트를 통과할 수준의 비디오 스토리 이해 기반의 질의응답 기술 개발
2 과학기술정보통신부 고려대학교산학협력단 ICT융합산업혁신기술개발(R&D) 촉각이 가능한 로봇 손으로 다양한 물체를 다루는 방법과 절차를 학습하는 로봇 손 조작 지능 개발
3 과학기술정보통신부 서울대학교 산학협력단 SW컴퓨팅산업원천기술개발(R&D,정보화) (SW 스타랩) 일상생활학습 기반의 인지에이전트 SW 개발
4 과학기술정보통신부 한국과학기술원 혁신성장동력프로젝트(R&D)(과기정통부) 뇌·인지 발달과정의 기초-영아단계 모사형 실세계 상호작용 경험 기반 객체 관련 개념의 기계학습 기술 개발
5 과학기술정보통신부 서울대학교 개인기초연구(과기정통부)(R&D) 실세계 응용을 위한 목표 지향적인 자기주도 강화학습 기술 연구