기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

분산형 강화 학습 시스템 및 이에 있어서의 병렬 강화 학습 방법

기술번호 : KST2022007834
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	분산 컴퓨팅 환경에서 효율적으로 시뮬레이터 기반 강화 학습을 실행할 수 있는 분산형 강화 학습 시스템과, 다수의 컴퓨팅 노드에서 병렬로 강화 학습이 이루어지도록 하는 강화 학습 방법을 제공한다. 강화 학습 시스템은 복수의 컴퓨팅 노드들과 학습 관리 서버를 구비한다. 복수의 컴퓨팅 노드들은 각각이 복수의 시뮬레이터들과 복수의 학습모듈들을 적재하고 실행할 수 있으며, 상기 복수의 시뮬레이터들 중 적어도 하나와 상기 복수의 학습모듈들 중 적어도 하나를 실행하여, 상기 적어도 하나의 시뮬레이터가 조성하는 환경에서 상기 적어도 하나의 학습모듈이 경험을 쌓으면서 지능을 향상시키도록 한다. 상기 학습 관리 서버는 상기 복수의 컴퓨팅 노드들 각각의 상태 정보를 수집하고 수집된 상태 정보를 토대로 상기 복수의 컴퓨팅 노드들 각각에서 실행될 상기 적어도 하나의 시뮬레이터와 상기 적어도 하나의 학습모듈을 배치한다. 특히 학습 관리 서버는 상기 복수의 컴퓨팅 노드들 각각에 대하여 시뮬레이션 실행 부하를 토대로 실행되는 시뮬레이터의 숫자를 조절한다.
Int. CL	G06N 20/20 (2019.01.01) H04L 65/40 (2022.01.01)
CPC	G06N 20/20(2013.01) H04L 67/10(2013.01)
출원번호/일자	1020200163822 (2020.11.30)
출원인	한국전자통신연구원
등록번호/일자
공개번호/일자	10-2022-0075579 (2022.06.08) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	장수영		대전광역시 유성구
2	박준희		대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인이상	대한민국	서울특별시 서초구 바우뫼로 **(양재동, 우도빌딩 층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2020.11.30	수리 (Accepted)	1-1-2020-1288947-94

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 각각이 복수의 시뮬레이터들과 복수의 학습모듈들을 적재하고 실행할 수 있으며, 상기 복수의 시뮬레이터들 중 적어도 하나와 상기 복수의 학습모듈들 중 적어도 하나를 실행하여, 상기 적어도 하나의 시뮬레이터가 조성하는 환경에서 상기 적어도 하나의 학습모듈이 경험을 쌓으면서 지능을 향상시키도록 하는 복수의 컴퓨팅 노드들; 및상기 복수의 컴퓨팅 노드들 각각의 상태 정보를 수집하고 수집된 상태 정보를 토대로 상기 복수의 컴퓨팅 노드들 각각에서 실행될 상기 적어도 하나의 시뮬레이터와 상기 적어도 하나의 학습모듈을 배치하는 학습 관리 서버;를 구비하고,상기 관리 서버가 프로세서; 및 상기 프로세서에 의해 실행되는 프로그램 명령어들을 저장하는 메모리;를 포함하고, 상기 프로그램 명령어들은 상기 프로세서에 의해 실행되었을 때: 상기 복수의 컴퓨팅 노드들 각각에 대하여 시뮬레이션 실행 부하를 토대로 상기 복수의 시뮬레이터들 중 실행되는 시뮬레이터의 숫자를 조절하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
2	2 청구항 1에 있어서, 상기 실행되는 시뮬레이터의 숫자를 조절하는 동작을 수행하는 명령은 상기 복수의 컴퓨팅 노드 각각에서 에피소드가 종료될 때마다 소정의 속도 지표가 일정한 기준치보다 낮은지 판단하는 동작; 및 상기 속도 지표가 상기 기준치보다 낮은 경우 종료된 에피소드에 연관된 시뮬레이터를 종료하고 새로운 시뮬레이터의 동작을 시작하지 않으며, 상기 속도 지표가 상기 기준치보다 낮지 않은 경우에만 새로운 시뮬레이터의 동작이 시작되게 하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
3	3 청구항 2에 있어서, 상기 속도 지표가 상기 기준치보다 낮은지 판단하는 동작을 수행하는 명령은 상기 프로세서에 의해 실행되었을 때 상기 기준치로서 상기 시뮬레이션 부하에 대한 임계치를 결정하는 동작; 일정한 시간간격마다 상기 복수의 컴퓨팅 노드 각각에서 실행중인 시뮬레이터들의 실시간계수 합산치를 기록하는 동작; 상기 복수의 컴퓨팅 노드 각각에서 에피소드 종료시마다 실행중이거나 실행이 종료되는 시뮬레이터들의 상기 실시간계수 합산치의 평균치를 계산하는 동작; 및 상기 평균치가 상기 임계치보다 큰 지 판단하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
4	4 청구항 2에 있어서, 상기 속도 지표가 상기 기준치보다 낮은지 판단하는 동작을 수행하는 명령은 상기 프로세서에 의해 실행되었을 때 일정한 시간간격마다 상기 복수의 컴퓨팅 노드 각각에서 실행중인 시뮬레이터들의 실시간계수 합산치를 기록하고, 상기 합산치의 이동평균을 계산하는 동작; 상기 복수의 컴퓨팅 노드 각각에서 에피소드 종료시마다 실행중이거나 실행이 종료되는 시뮬레이터들의 상기 실시간계수 합산치의 평균치를 계산하는 동작; 및 상기 평균치가 상기 이동평균보다 큰 지 판단하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
5	5 청구항 4에 있어서, 상기 평균치가 상기 이동평균보다 큰 지 판단하는 동작을 수행하는 명령은 상기 프로세서에 의해 실행되었을 때 해당 컴퓨팅 노드의 프로세서 부하가 일정 기준보다 큰 지를 추가적으로 판단하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
6	6 청구항 1에 있어서, 상기 프로그램 명령어들은 상기 프로세서에 의해 실행되었을 때: 상기 복수의 컴퓨팅 노드들 각각에서의 각 시뮬레이터의 상태와 상기 시뮬레이터가 형성하는 시뮬레이션 환경에서 학습을 행한 학습 모듈의 경험을 받아들이고, 상기 시뮬레이터 상태와 상기 학습 모듈 경험을 맵핑시킨 형태의 학습 상태를 저장 장치에 저장하는 동작; 다수의 학습 상태에 대하여 우선순위를 결정하는 동작; 및 상기 복수의 컴퓨팅 노드 각각에서 에피소드가 종료되어 새로운 시뮬레이터의 동작이 시작되어야 할 때 상기 우선순위가 높은 학습 상태가 실행되게 하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
7	7 청구항 6에 있어서, 상기 우선순위를 결정하는 동작을 수행하는 명령은 상기 프로세서에 의해 실행되었을 때 상기 복수의 학습모듈들이 잘 못하거나 낯선 학습 상태에 대하여 높은 우선순위를 부여하는 동작;을 수행하는 명령을 포함하는 강화 학습 시스템
8	8 각각이 복수의 시뮬레이터들과 복수의 학습모듈들을 적재하고 실행할 수 있는 복수의 컴퓨팅 노드들을 구비하는 강화 학습 시스템에서의, 병렬 강화 학습 방법으로서,상기 복수의 컴퓨팅 노드들 각각에서 상기 복수의 시뮬레이터들 중 적어도 하나와 상기 복수의 학습모듈들 중 적어도 하나가 실행되게 하여, 상기 적어도 하나의 시뮬레이터가 조성하는 환경에서 상기 적어도 하나의 학습모듈이 경험을 쌓으면서 지능을 향상시키도록 하는 단계; 및상기 복수의 컴퓨팅 노드 각각에서 에피소드가 종료될 때마다 상기 복수의 컴퓨팅 노드들 각각에 대하여 시뮬레이션 실행 부하를 토대로 상기 복수의 시뮬레이터들 중 실행되는 시뮬레이터의 숫자를 조절하는 단계;를 포함하는 병렬 강화 학습 방법
9	9 청구항 8에 있어서, 상기 시뮬레이터 숫자를 조절하는 단계가상기 복수의 컴퓨팅 노드 각각에서 에피소드가 종료될 때마다 소정의 속도 지표가 일정한 기준치보다 낮은지 판단하는 단계; 및상기 속도 지표가 상기 기준치보다 낮은 경우 종료된 에피소드에 연관된 시뮬레이터를 종료하고 새로운 시뮬레이터의 동작을 시작하지 않으며, 상기 속도 지표가 상기 기준치보다 낮지 않은 경우에만 새로운 시뮬레이터의 동작이 시작되게 하는 단계;를 포함하는 병렬 강화 학습 방법
10	10 청구항 9에 있어서, 상기 속도 지표가 상기 기준치보다 낮은지 판단하는 단계가상기 기준치로서 상기 시뮬레이션 부하에 대한 임계치를 결정하는 단계;일정한 시간간격마다 상기 복수의 컴퓨팅 노드 각각에서 실행중인 시뮬레이터들의 실시간계수 합산치를 기록하는 단계;상기 복수의 컴퓨팅 노드 각각에서 에피소드 종료시마다 실행중이거나 실행이 종료되는 시뮬레이터들의 상기 실시간계수 합산치의 평균치를 계산하는 단계; 및상기 평균치가 상기 임계치보다 큰 지 판단하는 단계;를 포함하는 병렬 강화 학습 방법
11	11 청구항 9에 있어서, 상기 속도 지표가 상기 기준치보다 낮은지 판단하는 단계가일정한 시간간격마다 상기 복수의 컴퓨팅 노드 각각에서 실행중인 시뮬레이터들의 실시간계수 합산치를 기록하고, 상기 합산치의 이동평균을 계산하는 단계;상기 복수의 컴퓨팅 노드 각각에서 에피소드 종료시마다 실행중이거나 실행이 종료되는 시뮬레이터들의 상기 실시간계수 합산치의 평균치를 계산하는 단계; 및상기 평균치가 상기 이동평균보다 큰 지 판단하는 단계;를 포함하는 병렬 강화 학습 방법
12	12 청구항 11에 있어서, 상기 평균치가 상기 이동평균보다 큰 지 판단하는 단계가해당 컴퓨팅 노드에서 프로세서의 부하가 일정 기준보다 큰 지를 판단하는 단계;를 더 포함하는 병렬 강화 학습 방법
13	13 청구항 8에 있어서,상기 복수의 컴퓨팅 노드들 각각에서의 각 시뮬레이터의 상태와 상기 시뮬레이터가 형성하는 시뮬레이션 환경에서 학습을 행한 학습 모듈의 경험을 받아들이고, 상기 시뮬레이터 상태와 상기 학습 모듈 경험을 맵핑시킨 형태의 학습 상태를 저장 장치에 저장하는 단계;다수의 학습 상태에 대하여 우선순위를 결정하는 단계; 및상기 복수의 컴퓨팅 노드 각각에서 에피소드가 종료되어 새로운 시뮬레이터의 동작이 시작되어야 할 때 상기 우선순위가 높은 학습 상태가 실행되게 하는 단계;를 더 포함하는 병렬 강화 학습 방법
14	14 청구항 13에 있어서, 상기 우선순위를 결정함에 있어서, 상기 복수의 학습모듈들이 잘 못하거나 낯선 학습 상태에 대하여 높은 우선순위를 부여하는 병렬 강화 학습 방법

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2020.11.30	수리 (Accepted)	1-1-2020-1288947-94


과제고유번호	1711122925
세부과제번호	20ZR1100
연구과제명	자율적으로 연결·제어·진화하는 초연결 지능화 기술 연구
성과구분	출원
부처명	과학기술정보통신부
연구관리전문기관명	한국전자통신연구원
연구주관기관명	한국전자통신연구원
성과제출연도	2020
연구기간	202001~202312
기여율	1
연구개발단계명	기초연구
6T분류명	IT(정보기술)

특허성과

[1020200163822]	분산형 강화 학습 시스템 및 이에 있어서의 병렬 강화 학습 방법	새창보기
[1020200151120]	조립 계획 수립 방법 및 장치	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2022005277][한국전자통신연구원]	모바일 엣지 컴퓨팅 환경에서의 적응형 딥러닝 추론 장치 및 방법	새창보기
[KST2022005470][한국전자통신연구원]	메시지 교환 방식을 이용한 계층화된 IoT 서비스 시스템	새창보기
[KST2022000810][한국전자통신연구원]	사물인터넷 장치의 클라우드 접속 방법 및 이를 수행하는 장치들	새창보기
[KST2022024435][한국전자통신연구원]	로봇과 인공지능 서비스 간의 자동화 통신 장치 및 이를 이용한 방법	새창보기
[KST2018004408][한국전자통신연구원]	사물들의 집단 기계학습 장치 및 방법(Device for collective machine learning of things and method thereof)	새창보기
[KST2021013412][한국전자통신연구원]	복수개의 머신 러닝 학습 모델을 이용한 이상 상황 탐지 방법 및 이를 위한 장치	새창보기
[KST2021000634][한국전자통신연구원]	기계학습 기반 예측 모델 재학습 장치 및 그 방법	새창보기
[KST2022002031][한국전자통신연구원]	무인 비행체의 동작 방법 및 장치	새창보기
[KST2022001858][한국전자통신연구원]	로라 네트워크에서 태스크 스케줄링 장치 및 방법	새창보기
[KST2020016303][한국전자통신연구원]	영상 인식 장치, 영상 인식 장치의 동작 방법, 그리고 영상 인식 장치를 포함하는 컴퓨팅 장치	새창보기
[KST2021005773][한국전자통신연구원]	입력 이미지 재구성 방법, 이미지 인식 방법 및 이를 위한 특징 변수 생성 장치	새창보기
[KST2021011771][한국전자통신연구원]	데이터 셋 관리 장치 및 이를 이용한 기계학습 모델과 데이터 셋 사이의 관계 표시 방법	새창보기
[KST2022022490][한국전자통신연구원]	공개키를 생성하는 앵커 방법 및 장치	새창보기
[KST2022022491][한국전자통신연구원]	임의의 시계열 예측 모델에 적용 가능한 온라인 예측 방법 및 예측 결과 조정 장치	새창보기
[KST2022002553][한국전자통신연구원]	센서 정보의 신선도를 제어하는 방법 및 장치	새창보기
[KST2022000650][한국전자통신연구원]	지능형 스케줄링 장치 및 방법	새창보기
[KST2022003310][한국전자통신연구원]	도커화된 인공지능 라이브러리에 대한 프록시 생성 장치 및 방법, 도커화된 인공지능 라이브러리 기반 ROS 분산 시스템	새창보기
[KST2021012995][한국전자통신연구원]	멀티 에이전트 기반의 강화학습 시스템에서 협업을 수행하는 방법 및 장치	새창보기
[KST2022002847][한국전자통신연구원]	분산 네트워크에서 데이터 전송 제어 방법 및 이를 수행하는 장치들	새창보기
[KST2022003326][한국전자통신연구원]	단말과 엣지 클라우드 서버 간의 분산 훈련 방법	새창보기
[KST2022005278][한국전자통신연구원]	정보 중심 기반 네트워킹 기반 블록체인 방법 및 장치	새창보기
[KST2022005286][한국전자통신연구원]	블록체인 플랫폼에서의 블록 전파 방법 및 장치	새창보기
[KST2022004817][한국전자통신연구원]	개인 정보에 대한 보안성을 제공하는 미터링 정보 제공 방법 및 미터링 정보 제공 장치	새창보기
[KST2022002561][한국전자통신연구원]	협력 자율 주행 장치 및 방법	새창보기
[KST2022003137][한국전자통신연구원]	선박의 통합 네트워크 환경 구축을 위한 에지 컴퓨팅 서비스 제공 장치 및 방법	새창보기
[KST2022005580][한국전자통신연구원]	네트워크 행위 기반 기기 식별 장치 및 방법	새창보기
[KST2022002043][한국전자통신연구원]	네트워크 데이터 분석 기능 장치를 위한 기계학습 모델 관리 방법	새창보기
[KST2022000932][한국전자통신연구원]	엣지 컴퓨팅 지원을 위한 정보 변경 알림 장치 및 방법	새창보기
[KST2022003063][한국전자통신연구원]	공장 제조 인프라와 연계하여 복수의 공장 연결이 가능한 엣지 커넥터 장치 및 그 관리 방법	새창보기
[KST2021000207][한국전자통신연구원]	앙상블 모델 기반 이상 진단 및 예측 방법과 장치	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.