기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

관리 네트워크와 커리큘럼 학습을 이용한 대규모 환경 멀티에이전트 강화학습 방법

기술번호 : KST2023001430
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 전장환경, 자율주행, 로봇 제어 등의 복잡도가 높은 대규모 학습 환경에서 멀티에이전트 강화학습을 위해 관리 네트워크와 커리큘럼 학습을 도입한 대규모 환경 멀티에이전트 강화학습 방법에 관한 것이다. 본 발명에 따른 멀티에이전트 강화학습 방법은, 목표 정보와 각 에이전트의 상태를 포함하는 환경 정보를 관리 네트워크에 입력하여 각 에이전트의 세부 목표를 출력하는 단계; 환경의 크기, 상기 세부 목표 및 상기 각 에이전트의 상태를 상기 각 에이전트의 네트워크에 입력하여 상기 각 에이전트의 행동을 출력하는 단계; 상기 각 에이전트의 행동에 따라 상기 각 에이전트의 다음 상태와 보상을 생성하고, 상기 환경 정보를 업데이트하며, 상기 보상 및 업데이트 전후의 환경 정보를 리플레이 메모리에 저장하는 단계; 상기 리플레이 메모리에서 샘플링한 정보를 기초로 상기 관리 네트워크 및 상기 각 에이전트의 네트워크를 학습하는 단계; 및 상기 각 에이전트의 보상의 합을 기초로 상기 환경의 크기를 소정의 값에 따라 증가시키는 단계;를 포함한다.
Int. CL	G06N 20/00 (2019.01.01) G06N 3/08 (2023.01.01) G06N 7/00 (2023.01.01)
CPC	G06N 20/00(2013.01) G06N 3/08(2013.01) G06N 7/01(2013.01)
출원번호/일자	1020210177916 (2021.12.13)
출원인	한국전자통신연구원
등록번호/일자
공개번호/일자	10-2023-0089357 (2023.06.20) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	N
심사청구항수	1

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	주소
1	도승원	대전광역시 유성구
2	이창은	대전광역시 유성구
3	백재욱	대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	특허법인지명	대한민국	서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2021.12.13	수리 (Accepted)	1-1-2021-1442875-19

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 목표 정보와 각 에이전트의 상태를 포함하는 환경 정보를 관리 네트워크에 입력하여 각 에이전트의 세부 목표를 출력하는 단계;환경의 크기, 상기 세부 목표 및 상기 각 에이전트의 상태를 상기 각 에이전트의 네트워크에 입력하여 상기 각 에이전트의 행동을 출력하는 단계;상기 각 에이전트의 행동에 따라 상기 각 에이전트의 다음 상태와 보상을 생성하고, 상기 환경 정보를 업데이트하며, 상기 보상 및 업데이트 전후의 환경 정보를 리플레이 메모리에 저장하는 단계;상기 리플레이 메모리에서 샘플링한 정보를 기초로 상기 관리 네트워크 및 상기 각 에이전트의 네트워크를 학습하는 단계; 및상기 각 에이전트의 보상의 합을 기초로 상기 환경의 크기를 소정의 값에 따라 증가시키는 단계;를 포함하는 대규모 환경 멀티에이전트 강화학습 방법

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2021.12.13	수리 (Accepted)	1-1-2021-1442875-19

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2022019161][한국전자통신연구원]	운전자 보조 시스템 및 그의 동작 방법	새창보기
[KST2021009953][한국전자통신연구원]	머신 러닝 알고리즘을 이용하는 난수 생성 장치	새창보기
[KST2020006675][한국전자통신연구원]	캐릭터의 3차원 이미지를 생성하는 방법 및 시스템	새창보기
[KST2023008720][한국전자통신연구원]	주차 점유 상태 확인 방법 및 장치	새창보기
[KST2021008136][한국전자통신연구원]	비정형 환경 자율주행을 위한 추종선 생성 방법 및 시스템	새창보기
[KST2021007114][한국전자통신연구원]	3차원 모델 생성 장치 및 방법	새창보기
[KST2021011686][한국전자통신연구원]	객체 검출 방법 및 장치	새창보기
[KST2019019708][한국전자통신연구원]	학습 기반 채널코드 디코딩 방법 및 장치	새창보기
[KST2023001406][한국전자통신연구원]	서리 예측 시스템 및 방법	새창보기
[KST2019013250][한국전자통신연구원]	이진 홀로그램 재현 장치 및 그 방법	새창보기
[KST2022005487][한국전자통신연구원]	다중전이 능동학습 기반 설비 이상 진단 시스템 및 그 방법	새창보기
[KST2021004160][한국전자통신연구원]	딥 러닝 기반으로 애니메이션 캐릭터를 학습하는 데 필요한 학습 데이터 생성 방법 및 장치	새창보기
[KST2022001860][한국전자통신연구원]	사운드 기반 위험상황 인식 장치 및 방법	새창보기
[KST2022020295][한국전자통신연구원]	신경망 모델을 이용한 오디오 신호의 부호화 및 복호화 방법 및 이를 수행하는 부호화기 및 복호화기 및 신경망 모델의 트레이닝 방법	새창보기
[KST2022016722][한국전자통신연구원]	학습 모델을 이용한 오디오 신호의 부호화 및 복호화 방법과 그 학습 모델의 트레이닝 방법 및 이를 수행하는 부호화기 및 복호화기	새창보기
[KST2020009844][한국전자통신연구원]	압축 센싱 신호 학습장치, 압축 센싱 신호 처리장치 및 방법	새창보기
[KST2019004229][한국전자통신연구원]	신경망 기계번역 방법 및 장치	새창보기
[KST2022007580][한국전자통신연구원]	소포구분기 인입 제어 시스템 및 방법	새창보기
[KST2021000227][한국전자통신연구원]	오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치	새창보기
[KST2023009288][한국전자통신연구원]	신호 압축 방법, 신호 복원 방법 및 상기 방법을 수행하는 신호 압축 장치 및 신호 복원 장치	새창보기
[KST2023008633][한국전자통신연구원]	부호화 방법 및 복호화 방법, 상기 방법을 수행하는 부호화기 및 복호화기	새창보기
[KST2023007145][한국전자통신연구원]	심층신경망 기반 다계층 구조를 활용한 오디오 신호의 압축 방법, 압축 장치, 및 그 훈련 방법	새창보기
[KST2023007384][한국전자통신연구원]	백색 잡음 모델링을 이용한 오디오 코덱 설계 및 테스트 방법 및 장치	새창보기
[KST2017014564][한국전자통신연구원]	공유된 개념벡터공간의 학습을 통한 자동번역 시스템 및 방법(SYSTEM AND METHOD FOR MACHINE TRANSLATION THROUGH LEARNING SHARED CONCEPT VECTOR SPACE)	새창보기
[KST2021012681][한국전자통신연구원]	쿠버네티스 환경에서의 이종 하드웨어 가속기 활용 방법 및 이를 이용한 장치	새창보기
[KST2021010786][한국전자통신연구원]	종단형 음성인식기의 강화학습 기반 준지도학습 방법 및 장치	새창보기
[KST2021001892][한국전자통신연구원]	동적 모델 파라미터를 이용한 오디오 부호화 방법 및 오디오 복호화 방법, 오디오 부호화 장치 및 오디오 복호화 장치	새창보기
[KST2021008075][한국전자통신연구원]	노치 필터를 이용한 학습 데이터 증강 장치 및 방법	새창보기
[KST2023005286][한국전자통신연구원]	이종 컴퓨팅 플랫폼 지원 딥러닝 컴파일러 및 그 방법	새창보기
[KST2023008087][한국전자통신연구원]	정규화 플로우를 활용한 오디오 신호를 부호화 및 복호화 하는 방법 및 그 학습 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.