맞춤기술찾기

이전대상기술

심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법, 이를 수행하기 위한 기록 매체 및 장치

  • 기술번호 : KST2022020631
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법은, 자율주행차량과 비 자율주행차량들이 운행하는 원형 도로의 환경에서 자율주행차량 학습을 위한 복수의 심층강화학습 중 하나의 알고리즘 및 보상함수를 선택하는 단계; 선택된 심층강화학습 알고리즘에 따라 심층신경망 구조를 결정하는 단계; 선택된 심층강화학습 알고리즘을 이용하여, 정해진 각 시간마다 자율주행차량의 속도 및 자율주행차량과 자율주행차량이 관측 가능한 차량 사이의 상대속도와 상대위치를 포함하는 상태 정보와 보상 정보를 기초로 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 단계; 및 자율주행차량의 행동을 결정하는 학습된 정책을 기반으로 자율주행차량을 운행하는 단계;를 포함한다. 이에 따라, 시뮬레이션을 통해 자율주행차량을 도로에 배치함으로써 원형 도로의 stop-and-go wave 현상을 해결할 수 있다.
Int. CL B60W 30/14 (2006.01.01) B60W 40/105 (2012.01.01) B60W 60/00 (2020.01.01) B60W 40/107 (2012.01.01) G06N 3/08 (2006.01.01) G05D 1/02 (2020.01.01) B60W 10/18 (2006.01.01) B60W 50/00 (2006.01.01)
CPC B60W 30/143(2013.01) B60W 40/105(2013.01) B60W 60/001(2013.01) B60W 40/107(2013.01) G06N 3/08(2013.01) G05D 1/0223(2013.01) B60W 2530/13(2013.01) B60W 2530/10(2013.01) B60W 2530/16(2013.01) B60W 2540/10(2013.01)
출원번호/일자 1020210091665 (2021.07.13)
출원인 숭실대학교산학협력단
등록번호/일자 10-2457914-0000 (2022.10.19)
공개번호/일자
공고번호/일자 (20221024) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210051960   |   2021.04.21
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.07.13)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권민혜 서울특별시 동작구
2 이동수 서울특별시 동작구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤귀상 대한민국 서울특별시 금천구 디지털로*길 ** ***호 (가산동, 한신IT타워*차)(디앤특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 서울특별시 동작구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.07.13 수리 (Accepted) 1-1-2021-0807673-75
2 특허고객번호 정보변경(경정)신고서·정정신고서
2021.10.28 수리 (Accepted) 4-1-2021-5282132-58
3 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.11.12 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-1305113-12
4 선행기술조사의뢰서
Request for Prior Art Search
2021.11.15 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2022.02.15 발송처리완료 (Completion of Transmission) 9-6-2022-0115977-12
6 의견제출통지서
Notification of reason for refusal
2022.07.25 발송처리완료 (Completion of Transmission) 9-5-2022-0555146-17
7 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.07.28 수리 (Accepted) 1-1-2022-0792500-89
8 [출원서 등 보완]보정서
2022.08.24 수리 (Accepted) 1-1-2022-0886790-28
9 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2022.08.24 수리 (Accepted) 1-1-2022-0886789-82
10 [공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서
[Document Verifying Exclusion from Being Publically Known (Novelty, Special Provisions for Application)] Submission of Document
2022.08.24 수리 (Accepted) 1-1-2022-0886791-74
11 등록결정서
Decision to grant
2022.10.18 발송처리완료 (Completion of Transmission) 9-5-2022-0795897-49
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
자율주행차량과 비 자율주행차량들이 운행하는 원형 도로의 환경에서 자율주행차량 학습을 위한 복수의 심층강화학습 중 하나의 알고리즘 및 보상함수를 선택하는 단계;선택된 심층강화학습 알고리즘에 따라 심층신경망 구조를 결정하는 단계;선택된 심층강화학습 알고리즘을 이용하여, 정해진 각 시간마다 자율주행차량의 속도 및 자율주행차량과 자율주행차량이 관측 가능한 차량 사이의 상대속도와 상대위치를 포함하는 상태 정보와 보상 정보를 기초로 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 단계; 및자율주행차량의 행동을 결정하는 학습된 정책을 기반으로 자율주행차량을 운행하는 단계;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
2 2
제1항에 있어서, 상기 복수의 심층강화학습 알고리즘 중 하나의 알고리즘을 선택하는 단계는,자율주행차량 학습을 위해 PPO, DDPG, TD3 및 심층강화학습 알고리즘 중 하나의 심층강화학습 알고리즘 및 심층신경망 구조를 선택하는 단계;선택된 심층강화학습 알고리즘에 따른 시뮬레이터(simulator)와 알고리즘에 대해 각각의 파라미터를 설정하는 단계; 및해당 심층강화학습 알고리즘의 심층신경망을 구성하는 파라미터를 초기화하는 단계;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
3 3
제1항에 있어서, 상기 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 단계는,선택된 심층강화학습 알고리즘을 이용하여, 정해진 각 시간마다 자율주행차량의 속도 및 자율주행차량과 자율주행차량이 관측 가능한 차량 사이의 상대속도와 상대위치를 포함하는 상태 정보를 획득하는 단계; 상태 정보에 따른 자율주행차량의 행동을 결정하는 단계; 자율주행차량의 행동에 따른 보상 정보를 획득하는 단계;자율주행차량의 행동에 따라 변화된 도로의 상태 정보를 획득하는 단계; 및보상 정보를 바탕으로 심층신경망을 업데이트 하는 단계;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
4 4
제3항에 있어서, 상기 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 단계는,심층신경망의 변화가 기준치 이상인지 판단하는 단계; 및심층신경망의 변화가 기준치 이상인 경우 정책의 학습을 종료하고, 심층신경망의 변화가 기준치 미만인 경우 정책의 학습을 지속하기 위하여 자율주행차량의 행동을 결정하는 단계;를 더 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
5 5
제1항에 있어서, 상기 자율주행차량의 행동은 가속도이며, 유한한 행동 공간은 음의 실수인 최소 가속도부터 양의 실수인 최대 가속도까지의 실수 집합인, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
6 6
제1항에 있어서, 상기 보상함수는, 목표 속도에 가까울수록 큰 값을 갖는 보상 항(reward term) 및 미리 설정된 임계값(threshold)과 자율주행차량의 가속도의 절대값 사이의 차이를 이용하는 처벌 항(penalty term)을 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
7 7
제1항에 있어서, 상기 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 단계는,각 시간마다 자율주행차량의 상태 정보를 획득하는 단계;획득한 상태 정보에서 행동을 선택하여 수행하는 단계;수행한 행동에 따른 보상 정보 및 다음 시간의 상태 정보를 획득하는 단계; 및획득한 상태 정보, 행동 정보, 보상 정보 및 다음 시간의 상태 정보를 각 알고리즘에 따른 목적함수(objective function)에 기초하여 네트워크 및 목표 네트워크를 포함하는 심층신경망을 업데이트하는 단계;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
8 8
제1항에 있어서, 상기 자율주행차량을 운행하는 단계는,자율주행차량의 상태 정보를 획득하는 단계;획득된 상태 정보에 따라 자율주행차량의 행동을 결정하는 단계; 및운행 종료 조건이 있는 경우, 운행을 종료하는 단계;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법
9 9
제1항에 따른 상기 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 저장 매체
10 10
자율주행차량과 비 자율주행차량들이 운행하는 원형 도로의 환경에서 자율주행차량 학습을 위한 복수의 심층강화학습 알고리즘 중 하나의 알고리즘을 선택하는 알고리즘 선택부;자율주행차량 학습을 위한 특정 상태에서 수행한 행동에 따른 보상 정보를 획득하기 위한 보상함수를 결정하는 보상함수 결정부;선택된 심층강화학습 알고리즘에 따라 심층신경망 구조를 결정하는 심층신경망 구조 결정부;선택된 심층강화학습 알고리즘을 이용하여, 정해진 각 시간마다 자율주행차량의 속도 및 자율주행차량과 자율주행차량이 관측 가능한 차량 사이의 상대속도와 상대위치를 포함하는 상태 정보와 보상 정보를 기초로 자율주행차량의 속도가 등속주행에 가장 가깝게 하는 정책을 학습하는 정책 학습부; 및자율주행차량의 행동을 결정하는 학습한 정책을 기반으로 자율주행차량을 운행하는 정책 활용부;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
11 11
제10항에 있어서, 상기 알고리즘 선택부는,자율주행차량 학습을 위해 PPO, DDPG, TD3 및 심층강화학습 알고리즘 중 하나의 심층강화학습 알고리즘 및 심층신경망 구조를 선택하고, 선택된 심층강화학습 알고리즘에 따른 시뮬레이터(simulator)와 알고리즘에 대해 각각의 파라미터를 설정한 후, 해당 심층강화학습 알고리즘의 심층신경망을 구성하는 파라미터를 초기화하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
12 12
제10항에 있어서, 상기 정책 학습부는,선택된 심층강화학습 알고리즘을 이용하여, 정해진 각 시간마다 자율주행차량의 속도 및 자율주행차량과 자율주행차량이 관측 가능한 차량 사이의 상대속도와 상대위치를 포함하는 상태 정보를 획득하여, 상태 정보에 따른 자율주행차량의 행동을 결정하는 제1 행동 결정부; 자율주행차량의 행동에 따른 보상 정보를 획득하는 보상 정보 획득부;자율주행차량의 행동에 따라 변화된 상태 정보를 획득하는 제1 상태 정보 획득부; 및보상 정보를 바탕으로 심층신경망을 업데이트 하는 심층신경망 업데이트부;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
13 13
제12항에 있어서, 상기 정책 학습부는,심층신경망의 변화가 기준치 이상인지 판단하여, 심층신경망의 변화가 기준치 이상인 경우 정책의 학습을 종료하고, 심층신경망의 변화가 기준치 미만인 경우 정책의 학습을 지속하기 위하여 자율주행차량의 행동을 결정하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
14 14
제10항에 있어서, 상기 자율주행차량의 행동은 가속도이며, 유한한 행동 공간은 음의 실수인 최소 가속도부터 양의 실수인 최대 가속도까지의 실수 집합인, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
15 15
제10항에 있어서, 상기 보상함수는, 목표 속도에 가까울수록 큰 값을 갖는 보상 항(reward term) 및 미리 설정된 임계값(threshold)과 자율주행차량의 가속도의 절대값 사이의 차이를 이용하는 처벌 항(penalty term)을 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
16 16
제10항에 있어서, 상기 정책 학습부는,미래의 누적 보상을 최대로 만드는 특정 상태에서 가능한 행동의 분포를 나타내는 확률적 또는 결정론적 정책을 결정하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
17 17
제10항에 있어서, 상기 정책 활용부는,자율주행차량의 상태 정보를 획득하는 제2 상태 정보 획득부; 및획득된 상태 정보에 따라 자율주행차량의 행동을 결정하고, 운행 종료 조건이 있는 경우, 운행을 종료하는 제2 행동 결정부;를 포함하는, 심층강화학습기반 자율주행차량을 이용한 정체 현상 해결 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 숭실대학교 개인기초연구(과기정통부) 모바일네트워크에서의 강화학습기반 분산적 의사결정방법 연구
2 과학기술정보통신부 숭실대학교 산학협력단 정보통신방송혁신인재양성 지능형 사이버 위협 대응 기술 개발 및 인력양성
3 과학기술정보통신부 이화여자대학교산학협력단 방송통신산업기술개발 분산/협력 AI 기반 5G+ 네트워크 데이터 분석 기능 및 제어 기술 개발