기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

분산 멀티-에이전트 시스템 내에서 강화 학습을 수행하는 방법 및 강화 학습을 수행하는 에이전트

기술번호 : KST2020013932
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명에서는 환경의 상태 정보를 획득하고, 상기 상태 정보에 기반하여 문제를 인지하는 단계와, 상기 분산 멀티에이전트 시스템 내의 적어도 하나의 이웃 에이전트에게 상기 문제를 해결하기 위한 협력을 요청하는 단계와, 상기 적어도 하나의 이웃 에이전트 중 제2 에이전트로부터 상기 요청에 대한 응답으로서 협력 정보를 수신하는 단계와, 및 상기 협력 정보를 이용하여 상기 환경에 행동을 적용하는 단계를 포함하는 분산 멀티에이전트 시스템 내의 제1 에이전트의 강화 학습 방법을 제공함으로써, 지능이 탑재된 단말이 분산된 실제 환경에서 서로 간 정보 공유 및 도움 요청을 통해 협력적으로 문제를 해결할 수 있다.
Int. CL	G06F 15/163 (2006.01.01) G06N 20/00 (2019.01.01)
CPC	G06F 15/163(2013.01) G06F 15/163(2013.01)
출원번호/일자	1020190038011 (2019.04.01)
출원인	한국전자통신연구원
등록번호/일자
공개번호/일자	10-2020-0116344 (2020.10.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	주소
1	김성현	대전광역시 서구
2	김명은	대전광역시 유성구
3	김현석	대전광역시 유성구
4	손영성	대전광역시 유성구
5	손종권	대전광역시 유성구
6	송순용	대전광역시 유성구
7	이동훈	세종특별자치시 보듬*
8	장인국	경기도 광명시 새터안로**번길
9	최진철	대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	팬코리아특허법인	대한민국	서울특별시 강남구 논현로길 , 역삼***빌딩 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2019.04.01	수리 (Accepted)	1-1-2019-0334041-10

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 분산 멀티에이전트 시스템 내의 제1 에이전트의 강화 학습 방법에 있어서,환경의 상태 정보를 획득하고, 상기 상태 정보에 기반하여 문제를 인지하는 단계;상기 분산 멀티에이전트 시스템 내의 적어도 하나의 이웃 에이전트에게 상기 문제를 해결하기 위한 협력을 요청하는 단계;상기 적어도 하나의 이웃 에이전트 중 제2 에이전트로부터 상기 요청에 대한 응답으로서 협력 정보를 수신하는 단계; 및상기 협력 정보를 이용하여 상기 환경에 행동을 적용하는 단계를 포함하는 방법
2	2 제1항에 있어서,상기 행동이 적용된 후 변화된 환경의 상태 정보를 획득하는 단계; 상기 변화된 환경의 상태 정보에 상응하는 보상을 획득하는 단계; 및상기 보상을 상기 제2 에이전트와 공유하는 단계를 더 포함하는방법
3	3 제2항에 있어서,상기 적어도 하나의 이웃 에이전트 중 상기 협력 정보를 전송하지 않은 이웃 에이전트와 상기 보상을 공유하는 단계를 더 포함하는방법
4	4 제3항에 있어서,상기 협력 요청은 상기 문제를 해결하기 위해 필요한 자원 데이터 또는 지식 데이터에 대한 요청을 포함하는방법
5	5 제1항에 있어서,상기 문제를 해결하기 위한 협력을 요청하는 단계는상기 문제를 상기 제1 에이전트 내에서 해결할 수 있는지 여부를 판단하는 단계; 및상기 판단 결과에 기반하여 상기 제2 에이전트로 상기 협력 요청을 전송하는 단계를 포함하는방법
6	6 제5항에 있어서,상기 행동을 상기 제1 에이전트 내에서 수행할 수 있는지 여부를 판단하는 단계는 상기 행동이 상기 제1 에이전트에 저장된 자원 데이터 또는 지식 데이터를 이용하여 수행될 수 있는 행동인지 여부를 판단하는 단계를 포함하는방법
7	7 제5항에 있어서,상기 문제를 상기 제1 에이전트 내에서 해결할 수 있는지 여부를 판단하는 단계는 상기 문제를 상기 제1 에이전트 내에서 해결할 때 보다 상기 제2 에이전트와 협력하는 것이 더 속도가 빠르거나 더 높은 정확도로 해결할 수 있는지 여부를 판단하는 단계를 포함하는방법
8	8 분산 멀티에이전트 시스템 내의 제1 에이전트의 강화 학습 방법에 있어서,상기 분산 멀티에이전트 시스템 내의 적어도 하나의 이웃 에이전트 중 제2 에이전트로부터 문제를 해결하기 위한 협력 요청을 수신하는 단계;상기 협력 요청에 응답하여 협력 정보를 상기 제2 에이전트로 전송하는 단계;상기 제2 에이전트로부터 상기 문제가 해결된 후 변화된 환경의 상태 정보에 상응하는 보상을 수신하는 단계; 및상기 보상을 이용하여 상기 문제에 대한 강화 학습을 수행하는 단계를 포함하는방법
9	9 제8항에 있어서,상기 협력 요청을 분석하는 단계; 및상기 분석 결과에 기반하여 상기 문제에 대하여 협력할지 여부를 판단하는 단계를 더 포함하며,상기 협력 요청에 응답하여 협력 정보를 상기 제2 에이전트로 전송하는 단계는 상기 판단 결과에 기반하여 상기 협력 정보를 상기 제2 에이전트로 전송하는 단계를 포함하는방법
10	10 제9항에 있어서,상기 협력 요청은 상기 문제를 해결하기 위해 필요한 자원 데이터 또는 지식 데이터에 대한 요청을 포함하며,상기 협력 요청을 분석하는 단계는 상기 문제를 해결하기 위해 필요한 자원 데이터 또는 지식 데이터가 상기 제1 에이전트에 저장되어 있는지 여부를 분석하는 단계를 포함하는방법
11	11 강화 학습을 수행하는 제1 에이전트로서,프로세서 및 메모리를 포함하고, 상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,환경의 상태 정보를 획득하고, 상기 상태 정보에 기반하여 문제를 인지하는 단계;상기 분산 멀티에이전트 시스템 내의 적어도 하나의 이웃 에이전트에게 상기 문제를 해결하기 위한 협력을 요청하는 단계;상기 적어도 하나의 이웃 에이전트 중 제2 에이전트로부터 상기 요청에 대한 응답으로서 협력 정보를 수신하는 단계; 및상기 협력 정보를 이용하여 상기 환경에 행동을 적용하는 단계를 수행하는 제1 에이전트
12	12 제11항에 있어서,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 행동이 적용된 후 변화된 환경의 상태 정보를 획득하는 단계; 상기 변화된 환경의 상태 정보에 상응하는 보상을 획득하는 단계; 그리고상기 보상을 상기 제2 에이전트와 공유하는 단계를 수행하는 제1 에이전트
13	13 제12항에 있어서,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 적어도 하나의 이웃 에이전트 중 상기 협력 정보를 전송하지 않은 이웃 에이전트와 상기 보상을 공유하는 단계를 수행하는 제1 에이전트
14	14 제13항에 있어서,상기 협력 요청은 상기 문제를 해결하기 위해 필요한 자원 데이터 또는 지식 데이터에 대한 요청을 포함하는제1 에이전트
15	15 제11항에 있어서,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 문제를 상기 제1 에이전트 내에서 해결할 수 있는지 여부를 판단하는 단계; 및상기 판단 결과에 기반하여 상기 제2 에이전트로 상기 협력 요청을 전송하는 단계를 수행하는 제1 에이전트
16	16 제15항에 있어서,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 행동이 상기 제1 에이전트에 저장된 자원 데이터 또는 지식 데이터를 이용하여 수행될 수 있는 행동인지 여부를 판단하는 단계를 수행하는 제1 에이전트
17	17 제15항에 있어서,상기 프로세서는 상기 메모리에 저장된 프로그램을 실행하여,상기 문제를 상기 제1 에이전트 내에서 해결할 때 보다 상기 제2 에이전트와 협력하는 것이 더 속도가 빠르거나 더 높은 정확도로 해결할 수 있는지 여부를 판단하는 단계를 수행하는 제1 에이전트

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	과학기술정보통신부	한국전자통신연구원	정부출연금사업(기관고유사업)	사물-사람-공간의 유기적 연결을 위한 초연결 공간의 분산 지능 핵심원천 기술

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2019.04.01	수리 (Accepted)	1-1-2019-0334041-10

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2015082540][한국전자통신연구원]	2×10 기가비트 이더넷 어플리케이션 구현 장치	새창보기
[KST2017012153][한국전자통신연구원]	음식 검색 서비스 제공 장치 및 방법(Apparatus and Method for Food Search Service)	새창보기
[KST2019000147][한국전자통신연구원]	부하분산 장치 및 방법	새창보기
[KST2015079027][한국전자통신연구원]	크로스바스위치 시스템의 상호연결스위치와입력버퍼스위치 간의 프로세서 통신 방법 및 장치	새창보기
[KST2015082049][한국전자통신연구원]	실시간 프리젠테이션 파일 공유 방법 및 장치	새창보기
[KST2015082427][한국전자통신연구원]	ＡＴＣＡ 시스템에서 ＩＰＭＩ 메시지를 이용한 보드의상태 정보 제공 방법 및 그 장치	새창보기
[KST2015100820][한국전자통신연구원]	멀티에이전트 기반 전자우편 시스템의 운용방법	새창보기
[KST2018006658][한국전자통신연구원]	결정적 및 비결정적 지식 처리의 융합을 위한 데이터 처리 장치 및 방법(Data processing apparatus and method for merging deterministic and non-deterministic knowledge information processing)	새창보기
[KST2018007056][한국전자통신연구원]	지식 증강을 위한 선순환 자가 학습 방법 및 그 장치	새창보기
[KST2014045705][한국전자통신연구원]	자바 애플리케이션의 네이티브 라이브러리 호출 장치 및 그 방법	새창보기
[KST2015079657][한국전자통신연구원]	고화질 인터넷 방송 서비스 시스템	새창보기
[KST2015099740][한국전자통신연구원]	다중 물리장치 접속을 위한 네트워크 프로세서 기반의패킷 포워딩 장치 및 그 방법	새창보기
[KST2015100495][한국전자통신연구원]	클럭의위상차를이용한버스조정회로	새창보기
[KST2018011927][한국전자통신연구원]	무선 통신 시스템에서 콘텐츠 전달을 위한 네트워크 구성 방법 및 네트워크 시스템	새창보기
[KST2015087516][한국전자통신연구원]	모바일 무선통신 ＤＭＢ 단말기에서 양방향 ＤＭＢ서비스를위한 ＤＭＢ 데이터 스트림 처리 장치 및 그 방법	새창보기
[KST2015099990][한국전자통신연구원]	애플리케이션 프로세싱 모듈 장치	새창보기
[KST2017009235][한국전자통신연구원]	건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치(THE METHOD FOR PREDICTION HEALTH DATA VALUE THROUGH GENERATION OF HEALTH DATA PATTERN AND THE APPARATUS THEREOF)	새창보기
[KST2018001624][한국전자통신연구원]	행위자 기반의 분산 병렬 시뮬레이션 가속 시스템 및 그 방법(actor-based distributed parallel simulation acceleration system and method therefor)	새창보기
[KST2018009727][한국전자통신연구원]	기계학습 지식 및 자동화된 기계 학습 절차 기반의 자가 학습 시스템	새창보기
[KST2015075943][한국전자통신연구원]	내포 트랜잭션을 지원하는 분산 트랙잭션 승인 규약 처리 방법	새창보기
[KST2015101434][한국전자통신연구원]	어레이프로세서간의자원공유를위한구조	새창보기
[KST2015075151][한국전자통신연구원]	멀티프로세서시스템	새창보기
[KST2015085941][한국전자통신연구원]	이기종 로봇의 협업을 위한 컴포넌트 연동 장치 및 그에 따른 방법	새창보기
[KST2015091566][한국전자통신연구원]	테스트 환경 설정 장치, 및 테스트 환경 설정 장치를 이용하는 네트워크 시뮬레이션 장치의 작동 방법	새창보기
[KST2015079639][한국전자통신연구원]	디지털 오디오 방송 수신 모뎀으로부터 데이터를 전송하기위한 데이터 전송 장치	새창보기
[KST2015088850][한국전자통신연구원]	프로세스 통신을 지원하는 서버 및 그의 동작 방법	새창보기
[KST2015080189][한국전자통신연구원]	지능형 네트워크 디스플레이 시스템 및 방법	새창보기
[KST2015083595][한국전자통신연구원]	멀티코어 시스템 환경에서 내부 코어 간 통신채널을 이용한 모듈 디바이스의 동적 적재 및 실행을 통한 부하 균등화 시스템 및 방법	새창보기
[KST2015094012][한국전자통신연구원]	고속 병렬 컴퓨터 통신 전용 노드 상의 터미널 장치 구동방법	새창보기
[KST2016013653][한국전자통신연구원]	이벤트 프로비저닝 처리 장치(DEVICE FOR EVENT PROVISIONIG PROCESSING)	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.