기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템

기술번호 : KST2023008006
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템에 관한 것으로, 복수의 무인운반차 각각을 제어하기 위한 에이전트에서, 사전에 설정한 시나리오에 따라 목적지까지 이동하기 위한 무인운반차의 행동을 추출하기 위한 강화학습을 수행할 때, 개별보상을 늘려 누적 전역보상을 최대화하고 손실(loss)을 최소화하는 방향으로 상기 강화학습을 수행함으로써 복수의 무인운반차의 충돌이나 고립을 방지하고 목적지까지 최적의 경로로 이동할 수 있도록 하는 시스템에 관한 것이다.
Int. CL	G05D 1/02 (2020.01.01) G05D 1/00 (2006.01.01) G06V 40/20 (2022.01.01) G06N 20/00 (2019.01.01)
CPC	G05D 1/0221(2013.01) G05D 1/0005(2013.01) G06V 40/20(2013.01) G06N 20/00(2013.01)
출원번호/일자	1020220030165 (2022.03.10)
출원인	한국기술교육대학교 산학협력단
등록번호/일자
공개번호/일자	10-2023-0133077 (2023.09.19) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	공개
심사진행상태	수리
심판사항
구분	국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2022.03.10)
심사청구항수	12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국기술교육대학교 산학협력단	대한민국	충청남도 천안시 동남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	주소
1	한연희	대전광역시 유성구
2	최호빈	충청남도 천안시 동남구
3	김주봉	충청북도 청주시 흥덕구
4	임현교	대구광역시 중구
5	지창훈	충청북도 청주시 흥덕구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	김견수	대한민국	서울특별시 강남구 강남대로길 , ***호(역삼동, 도연빌딩)(다함특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
최종권리자 정보가 없습니다

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2022.03.10	수리 (Accepted)	1-1-2022-0260979-45
2	특허고객번호 정보변경(경정)신고서·정정신고서	2022.05.30	수리 (Accepted)	4-1-2022-5126885-28
3	선행기술조사의뢰서 Request for Prior Art Search	2022.12.15	수리 (Accepted)	9-1-9999-9999999-89
4	특허고객번호 정보변경(경정)신고서·정정신고서	2023.01.30	수리 (Accepted)	4-1-2023-5022136-89
5	특허고객번호 정보변경(경정)신고서·정정신고서	2023.06.28	수리 (Accepted)	4-1-2023-5167406-12
6	특허고객번호 정보변경(경정)신고서·정정신고서	2023.08.17	수리 (Accepted)	4-1-2023-5213789-07

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 무인운반차에 대한 현재의 관측데이터를 에이전트 강화학습모델에 입력하여 행동가치가 높은 행동을 추출하는 에이전트; 및각 상기 에이전트별로 상기 추출한 행동에 따른 개별보상을 제공하는 매니저;를 포함하며,상기 에이전트 강화학습모델에 상기 개별보상과 상기 행동가치를 이용하여 계산한 로컬손실을 적용하여 강화학습하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
2	2 청구항 1에 있어서,상기 에이전트는,상기 현재의 관측데이터와 이전에 추출한 행동을 상기 에이전트 강화학습모델에 입력하여 상기 행동가치가 높은 행동을 추출하는 행동 추출부;상기 현재의 관측데이터를 포함하는 과거의 관측데이터 및 상기 추출한 행동을 포함하는 상기 행동가치를 상기 매니저로 제공하는 행동가치 제공부; 및상기 매니저로부터 수신한 상기 개별보상에 따라 상기 행동가치를 조정하여 상기 로컬손실을 계산하는 로컬손실 계산부;를 더 포함하며,상기 로컬손실은, 상기 개별보상이 높을수록 상기 행동가치를 높게 조정함으로써 최소화되며, 상기 에이전트 강화학습모델에서 역전파되어 상기 현재의 관측데이터에 따라 상기 행동가치가 높은 행동을 추출하도록 상기 강화학습에 이용되는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
3	3 청구항 1에 있어서,상기 관측데이터는, 상기 무인운반차가 적용된 현장을 복수의 셀로 구성한 레이아웃에서, 각 상기 무인운반차를 중심으로 사전에 설정한 범위에 대한 제1 채널 이미지 및 제2 채널 이미지를 포함하여 구성되며,상기 제1 채널 이미지는, 상기 범위 내의 각 상기 셀에 대한 상기 무인운반차의 이동 가능여부를 포함하며,상기 제2 채널 이미지는, 상기 범위 내의 각 상기 셀에 대한 상기 무인운반차의 목적지까지 남은 거리정보를 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
4	4 청구항 3에 있어서,상기 매니저는,각 상기 에이전트로부터 제공받은 각 행동가치와 상기 레이아웃에서 각 셀에 대한 에이전트의 현재 누적 방문횟수를 포함하는 전역 상태데이터를 매니저 강화학습모델에 입력하여 모든 에이전트의 행동에 따른 공동행동가치를 추출하는 공동행동가치 추출부; 및상기 개별보상을 모두 합산한 전역보상 및 상기 공동행동가치에 따라 전역손실을 계산하여 각 상기 에이전트로 제공하는 전역손실 계산부;를 더 포함하며,상기 에이전트는, 상기 로컬손실과 상기 전역손실을 합산하여 최종 손실을 계산하고, 상기 에이전트 강화학습모델에 상기 최종 손실을 역전파하여 상기 강화학습을 수행하는 것을 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
5	5 청구항 1에 있어서,상기 에이전트는,사전에 부여된 식별자에 따라 순차적으로 상기 행동을 추출하며,상기 행동을 순차적으로 추출하기 위해, 상기 식별자 순으로 상기 추출한 행동에 따른 상기 무인운반차의 제어결과를 현장에 대한 레이아웃에 마스킹하여 마스킹 데이터를 생성하고, 상기 매니저를 통해 상기 마스킹 데이터를 다음 순서의 식별자를 가지는 에이전트로 순차적으로 공유하도록 함으로써 무인운반차 상호간에 충돌이 발생하지 않도록 하는 행동을 추출하도록 하는 것을 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
6	6 청구항 1에 있어서,상기 에이전트는,상기 강화학습을 수행한 결과에 따라 상기 무인운반차에 대한 실제 관측데이터를 상기 에이전트 강화학습모델에 입력하여 행동가치가 높은 행동을 추출하여 다른 에이전트와 독립적으로 상기 무인운반차의 목적지까지 최적 경로로 제어하는 무인운반차 제어부;를 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 시스템
7	7 무인운반차의 에이전트에서, 무인운반차에 대한 현재의 관측데이터를 에이전트 강화학습모델에 입력하여 행동가치가 높은 행동을 추출하는 단계; 및매니저에서, 각 상기 에이전트별로 상기 추출한 행동에 따른 개별보상을 제공하는 단계;를 포함하며,상기 에이전트 강화학습모델에 상기 개별보상과 상기 행동가치를 이용하여 계산한 로컬손실을 적용하여 강화학습하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법
8	8 청구항 1에 있어서,상기 방법은,상기 에이전트에서, 상기 현재의 관측데이터와 이전에 추출한 행동을 상기 에이전트 강화학습모델에 입력하여 상기 행동가치가 높은 행동을 추출하는 행동 추출 단계;상기 에이전트에서, 상기 현재의 관측데이터를 포함하는 과거의 관측데이터 및 상기 추출한 행동을 포함하는 상기 행동가치를 상기 매니저로 제공하는 행동가치 제공 단계; 및상기 에이전트에서, 상기 매니저로부터 수신한 상기 개별보상에 따라 상기 행동가치를 조정하여 상기 로컬손실을 계산하는 로컬손실 계산 단계;를 더 포함하며,상기 로컬손실은, 상기 개별보상이 높을수록 상기 행동가치를 높게 조정함으로써 최소화되며, 상기 에이전트 강화학습모델에서 역전파되어 상기 현재의 관측데이터에 따라 상기 행동가치가 높은 행동을 추출하도록 상기 강화학습에 이용되는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법
9	9 청구항 7에 있어서,상기 관측데이터는, 상기 무인운반차가 적용된 현장을 복수의 셀로 구성한 레이아웃에서, 각 상기 무인운반차를 중심으로 사전에 설정한 범위에 대한 제1 채널 이미지 및 제2 채널 이미지를 포함하여 구성되며,상기 제1 채널 이미지는, 상기 범위 내의 각 상기 셀에 대한 상기 무인운반차의 이동 가능여부를 포함하며,상기 제2 채널 이미지는, 상기 범위 내의 각 상기 셀에 대한 상기 무인운반차의 목적지까지 남은 거리정보를 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법
10	10 청구항 9에 있어서,상기 방법은,상기 매니저에서, 각 상기 에이전트로부터 제공받은 각 행동가치와 상기 레이아웃의 각 셀에 대한 에이전트의 현재 누적 방문횟수를 포함하는 전역 상태데이터를 매니저 강화학습모델에 입력하여 모든 에이전트의 행동에 따른 공동행동가치를 추출하는 공동행동가치 추출 단계; 및상기 매니저에서, 상기 개별보상을 모두 합산한 전역보상 및 상기 공동행동가치에 따라 전역손실을 계산하여 각 상기 에이전트로 제공하는 전역손실 계산 단계;를 더 포함하며,상기 에이전트는, 상기 로컬손실과 상기 전역손실을 합산하여 최종 손실을 계산하고, 상기 에이전트 강화학습모델에 상기 최종 손실을 역전파하여 상기 강화학습을 수행하는 것을 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법
11	11 청구항 7에 있어서,상기 에이전트는,사전에 부여된 식별자에 따라 순차적으로 상기 행동을 추출하며,상기 행동을 순차적으로 추출하기 위해, 상기 식별자 순으로 상기 추출한 행동에 따른 상기 무인운반차의 제어결과를 현장에 대한 레이아웃에 마스킹하여 마스킹 데이터를 생성하고, 상기 매니저를 통해 상기 마스킹 데이터를 다음 순서의 식별자를 가지는 에이전트로 순차적으로 공유하도록 함으로써 무인운반차 상호간에 충돌이 발생하지 않도록 하는 행동을 추출하도록 하는 것을 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법
12	12 청구항 7에 있어서,상기 방법은,상기 에이전트에서, 상기 강화학습을 수행한 결과에 따라 상기 무인운반차에 대한 실제 관측데이터를 상기 에이전트 강화학습모델에 입력하여 행동가치가 높은 행동을 추출하여 다른 에이전트와 독립적으로 상기 무인운반차의 목적지까지 최적 경로로 제어하는 무인운반차 제어 단계;를 더 포함하는 것을 특징으로 하는 다중 에이전트 강화학습 기반 다중 무인운반차 최적 경로 제어 방법

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	교육부	한국기술교육대학교 산학협력단	이공분야 대학중점 연구소 지원사업	상호작용 가상현실 기반 몰입형 교육 훈련 플랫폼

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2022.03.10	수리 (Accepted)	1-1-2022-0260979-45
2	특허고객번호 정보변경(경정)신고서·정정신고서	2022.05.30	수리 (Accepted)	4-1-2022-5126885-28
3	선행기술조사의뢰서	2022.12.15	수리 (Accepted)	9-1-9999-9999999-89
4	특허고객번호 정보변경(경정)신고서·정정신고서	2023.01.30	수리 (Accepted)	4-1-2023-5022136-89
5	특허고객번호 정보변경(경정)신고서·정정신고서	2023.06.28	수리 (Accepted)	4-1-2023-5167406-12
6	특허고객번호 정보변경(경정)신고서·정정신고서	2023.08.17	수리 (Accepted)	4-1-2023-5213789-07

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2020010016][한국기술교육대학교]	딥러닝 기반 영상 내 객체 인식 시스템	새창보기
[KST2020007953][한국기술교육대학교]	매핑기반 자율주행 카트 및 그 제어 방법	새창보기
[KST2022006422][한국기술교육대학교]	계층적 다중 레이블 분류를 위한 데이터 분류 방법 및 장치	새창보기
[KST2021002489][한국기술교육대학교]	군집 무인 이동체의 에너지 최적화	새창보기
[KST2022019662][한국기술교육대학교]	문서 내 현안 분석 및 추출하기 위한 방법	새창보기
[KST2020005360][한국기술교육대학교]	스마트 캐리어	새창보기
[KST2017013067][한국기술교육대학교]	ＩＮＳ 및 ＧＰＳ를 이용한 무인 자동차 제어 장치 및 방법(APPARATUS AND METHOD OF CONTROLLING SELF-DRIVING CAR USING INERTIAL NAVIGATION SYSTEM AND GLOBAL POSITIONING SYSTEM)	새창보기
[KST2022020023][한국기술교육대학교]	자율형 CPS의 성능 자가진화를 위한 연합 강화학습 기반의 자율형 CPS 자가진화 프레임워크 및 이를 이용한 자율형 CPS의 성능 자가진화 방법	새창보기
[KST2023009470][한국기술교육대학교]	이동체의 경로 탐색 시스템 및 방법	새창보기
[KST2023009471][한국기술교육대학교]	이동체의 경로 탐색 시스템 및 방법	새창보기
[KST2021003229][한국기술교육대학교]	증강현실 기반의 드론 라이트 쇼 구현	새창보기
[KST2020015035][한국기술교육대학교]	연합강화학습을 통한 다중 디바이스 제어 시스템 및 그 방법	새창보기
[KST2021005305][한국기술교육대학교]	FOD 탐지 모듈이 구비된 이동 로봇 및 이를 이용한 FOD 수거 방법	새창보기
[KST2014056297][한국기술교육대학교]	랜드마크를 이용한 로봇의 자기위치 인식 시스템	새창보기
[KST2023008347][한국기술교육대학교]	눈깜빡임 패턴을 이용한 십진 패스워드 입력 장치 및 그 방법	새창보기
[KST2022006410][한국기술교육대학교]	딥러닝과 마커를 이용한 비전인식을 통한 로봇 제어장치 및 그 방법	새창보기
[KST2022009867][한국기술교육대학교]	자율주행 경로 생성 방법	새창보기
[KST2015205360][한국기술교육대학교]	지능형 카트 및 제어 방법	새창보기
[KST2019030251][한국기술교육대학교]	강화 학습 기반 CCTV용 차량 번호 인식 방법	새창보기
[KST2022017940][한국기술교육대학교]	기계 학습 훈련을 위한 데이터 생성방법 및 시스템	새창보기
[KST2021007333][한국기술교육대학교]	장애물의 특성을 고려한 DQN 및 SLAM 기반의 맵리스 내비게이션 시스템 및 그 처리 방법	새창보기
[KST2022009877][한국기술교육대학교]	비지도 학습 기반의 깊이 예측 방법 및 이를 이용하는 시스템	새창보기
[KST2022024606][한국기술교육대학교]	손가락 재활 훈련을 위한 증강현실 콘텐츠 제공 방법 및 손가락 재활 훈련 시스템	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.