맞춤기술찾기

이전대상기술

강화학습 시스템 상의 개체 포팅 방법 및 장치

  • 기술번호 : KST2022007267
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 임의의 하드웨어 또는 소프트웨어 개체를 강화학습 시스템에 포팅(porting)하기 위한 장치 및 방법에 관한 것이다. 본 개시에 적용 가능한 일 실시 예에 따르면, 프록시가 에이전트 인터페이스로부터 사건 개시 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 개체 인터페이스로 전달하는 단계, 상기 프록시가 상기 개체 인터페이스로부터 제1 관찰 정보를 포함한 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계, 상기 프록시가 상기 에이전트 인터페이스로부터 행동 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스로 전달하는 단계, 상기 프록시가 상기 개체 인터페이스로부터 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계를 포함할 수 있다.
Int. CL G06F 8/76 (2018.01.01) G06F 8/61 (2018.01.01)
CPC G06F 8/76(2013.01) G06F 8/61(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020200160073 (2020.11.25)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2022-0072456 (2022.06.02) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.02.17)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 신승재 세종특별자치시 다정북로 **
2 전홍석 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 성병기 대한민국 서울특별시 서초구 사임당로 **, **층 (서초동, 재우빌딩)(마루특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.11.25 수리 (Accepted) 1-1-2020-1270630-61
2 [심사청구]심사청구서·우선심사신청서
2022.02.17 수리 (Accepted) 1-1-2022-0177192-05
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
강화학습 시스템 상의 개체 포팅(porting) 방법에 있어서,프록시가 에이전트 인터페이스로부터 사건 개시 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 개체 인터페이스로 전달하는 단계;상기 프록시가 상기 개체 인터페이스로부터 제1 관찰 정보를 포함한 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계;상기 프록시가 상기 에이전트 인터페이스로부터 행동 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스로 전달하는 단계; 및상기 프록시가 상기 개체 인터페이스로부터 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계;를 포함하는, 개체 포팅 방법
2 2
제1항에 있어서,상기 제1 동기화는,개체의 사건 진행 시 에이전트의 동작을 멈추고 대기시키는 동기화인, 개체 포팅 방법
3 3
제2항에 있어서,상기 수신한 메시지를 제1 동기화에 기초하여 개체 인터페이스로 전달하는 단계들은,상기 프록시가 상기 에이전트 인터페이스에게 제1 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 방법
4 4
제1항에 있어서,상기 제2 동기화는 에이전트의 의사 결정 시 개체의 사건 진행을 멈추고 대기시키는 동기화인, 개체 포팅 방법
5 5
제4항에 있어서,상기 수신한 메시지를 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계들은,상기 프록시가 상기 개체 인터페이스에게 제2 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 방법
6 6
제1항에 있어서,상기 프록시가 메시지 수신 시 필요한 경우에 수신한 메시지에 기초하여 내부 동작 파라미터를 업데이트하는 단계를 더 포함하는, 개체 포팅 방법
7 7
제1항에 있어서,상기 프록시가 개체 인터페이스 또는 에이전트 인터페이스에게 전달하는 메시지들은,상기 프록시가 수신한 메시지들이 전달한 파라미터 및 상기 프록시가 수신한 메시지들에 기초하여 새로 생성한 파라미터를 포함하는, 개체 포팅 방법
8 8
제1항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 초기화 정보를 포함하는 메시지를 수신하는 단계;상기 프록시가 상기 초기화 정보를 포함하는 메시지에 기초하여 필요한 경우 파라미터를 초기화하는 단계; 상기 프록시가 상기 개체 인터페이스에게 상기 초기화 정보를 포함하는 메시지를 전달하는 단계; 및상기 프록시가 상기 개체 인터페이스로부터 초기화 응답 정보를 포함하는 메시지를 수신하고, 에이전트 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
9 9
제1항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 종료 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
10 10
제9항에 있어서,상기 프록시가 상기 개체 인터페이스로부터 종료 응답 정보를 포함하는 메시지를 수신하고, 상기 에이전트 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
11 11
강화학습 시스템 상의 개체 포팅(porting) 장치에 있어서,에이전트 인터페이스; 프록시; 및개체 인터페이스;를 포함하고,상기 프록시가 상기 에이전트 인터페이스로부터 사건 개시 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 개체 인터페이스로 전달하며,상기 프록시가 상기 개체 인터페이스로부터 제1 관찰 정보를 포함한 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하되,상기 프록시가 상기 에이전트 인터페이스로부터 행동 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스로 전달하고,상기 프록시가 상기 개체 인터페이스로부터 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는, 개체 포팅 장치
12 12
제11항에 있어서,상기 제1 동기화는,개체의 사건 진행 시 에이전트의 동작을 멈추고 대기시키는 동기화인, 개체 포팅 장치
13 13
제12항에 있어서,상기 제1 동기화에 기초한 개체 인터페이스로 전달들은,상기 프록시가 상기 에이전트 인터페이스에게 제1 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 장치
14 14
제11항에 있어서,상기 제2 동기화는 에이전트의 의사 결정 시 개체의 사건 진행을 멈추고 대기시키는 동기화인, 개체 포팅 장치
15 15
제14항에 있어서,상기 제2 동기화에 기초한 상기 에이전트 인터페이스로 전달들은,상기 프록시가 상기 개체 인터페이스에게 제2 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 장치
16 16
제11항에 있어서,상기 프록시가 메시지 수신 시 필요한 경우에 수신한 메시지에 기초하여 내부 동작 파라미터를 업데이트하는, 개체 포팅 장치
17 17
제11항에 있어서,상기 프록시가 상기 개체 인터페이스 또는 상기 에이전트 인터페이스에게 전달하는 메시지들은,상기 프록시가 수신한 메시지들이 전달한 파라미터 및 상기 프록시가 수신한 메시지에 기초하여 새로 생성한 파라미터를 포함하는, 개체 포팅 장치
18 18
제11항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 초기화 정보를 포함하는 메시지를 수신하고,상기 프록시가 상기 초기화 정보를 포함하는 메시지에 기초하여 필요한 경우 파라미터를 초기화하며, 상기 프록시가 상기 개체 인터페이스에게 상기 초기화 정보를 포함하는 메시지를 전달하되, 상기 프록시가 상기 개체 인터페이스로부터 초기화 응답 정보를 포함하는 메시지를 수신하고, 상기 에이전트 인터페이스에게 전달하는, 개체 포팅 장치
19 19
제11항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 종료 정보를 포함하는 메시지를 수신하고 제1 동기화에 기초하여 상기 개체 인터페이스에게 전달하되,상기 프록시가 개체 인터페이스로부터 종료 응답 정보를 포함하는 메시지를 수신하고 에이전트 인터페이스에게 전달하는, 개체 포팅 장치
20 20
강화학습 시스템 상의 개체 포팅(porting) 장치에 있어서,에이전트 인터페이스; 프록시; 및개체 인터페이스;를 포함하고,상기 에이전트 인터페이스가 상기 프록시로 사건 개시 정보를 포함하는 메시지를 전달하고, 상기 개체 인터페이스는 상기 프록시로부터 제1 동기화에 기초하여 상기 사건 개시 정보를 포함하는 메시지를 수신하며,상기 개체 인터페이스가 상기 프록시로 제1 관찰 정보를 포함한 메시지를 전달하고, 상기 에이전트 인터페이스는 상기 프록시로부터 제2 동기화에 기초하여 상기 제1 관찰 정보를 포함한 메시지를 수신하되,상기 에이전트 인터페이스가 상기 프록시로 행동 정보를 포함하는 메시지를 전달하고, 상기 개체 인터페이스는 제1 동기화에 기초하여 상기 프록시로부터 상기 행동 정보를 포함하는 메시지를 수신하고,상기 개체 인터페이스가 상기 프록시로 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 전달하고, 상기 에이전트 인터페이스가 상기 프록시로부터 제2 동기화에 기초하여 상기 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하는, 개체 포팅 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 ETRI ETRI연구개발지원사업 초연결 지능 인프라 원천기술 연구개발