1 |
1
교통 신호 제어 장치에 있어서, 제1 스테이트를 기반으로 배리어간 녹색 시간 조정 비율과 상충현시간 녹색 시간 조정 비율을 제1 액션으로 도출하고, 교차로 신호 제어 변수를 출력하는 교차로 학습부와;제2 스테이트를 기반으로 교차로별 옵셋 조정 비율과 교차로별 옵셋을 제2 액션으로 도출하고, 네트워크 신호 제어 변수를 출력하는 네트워크 학습부와;입력되는 이동류별 통과 교통량과 이동류별 초기 대기 행렬을 기반으로 교통 상황을 모사하여 상기 제1 스테이트를 상기 교차로 학습부로 출력하고, 상기 제2 스테이트를 상기 네트워크 학습부로 출력하고, 상기 제1 액션 및 상기 제2 액션을 기반으로 상기 교통 상황을 다시 모사하여 상기 제1 스테이트와 상기 제2 스테이트를 갱신하는 교통 학습 모형부와;상기 교차로 신호 제어 변수 및 상기 네트워크 신호 제어 변수를 수신하고, 상기 교차로 신호 제어 변수 및 상기 네트워크 신호 제어 변수를 교통 신호 네트워크에 적용하는 신호 제어부를 포함하는 것을 특징으로 하는 교통 신호 제어 장치
|
2 |
2
제1항에 있어서, 제1 스테이트는 현시이동류별 공간 점유률, 현시이동류별 녹색시간 비율, 교차로 평균 제어 지체 및 현시별 포화도 중 적어도 하나를 포함하고, 상기 제2 스테이트는 제어 교차로 간 구간 평균 제어 지체 및 교차로별 옵셋을 포함하고,상기 교차로 신호 제어 변수는 현시별 녹색 시간을 포함하고, 상기 네트워크 신호 제어 변수는 신호 변화 주기, 및 교차로 옵셋을 포함하는 것을 특징으로 하는 교통 신호 제어 장치
|
3 |
3
제1항에 있어서, 상기 교차로 학습부 및 상기 네트워크 학습부는 연속적인 액션 스페이스 학습을 수행하는 DDPG(Deep Deterministic Policy Gradient) 알고리즘을 포함하는 것을 특징으로 하는 교통 신호 제어 장치
|
4 |
4
제3항에 있어서, 상기 교통 학습 모형부는,상기 제1 액션으로 인하여 교차로 지체가 감소되면 상기 제1 액션을 보상하고, 상기 제2 액션으로 인하여 네트워크 지체가 감소되면 상기 제2 액션을 보상하는 것을 특징으로 하는 교통 신호 제어 장치
|
5 |
5
제2항에 있어서, 상기 교통 학습 모형부는 시공간적 셀 단위로 교통류 충격파 전파를 나타내는 셀 전파 모델을 기반으로 상기 시공간적 셀의 지체를 도출하고, 상기 지체를 기반으로 상기 제1 스테이트 및 상기 제2 스테이트를 도출하는 것을 특징으로 하는 교통 신호 제어 장치
|
6 |
6
제1항에 있어서, 상기 교차로 신호 제어 변수는 소정 신호 주기 마다 최적화되고, 상기 네트워크 신호 제어 변수는 소정 시간 마다 최적화 되는 것을 특징으로 하는 교통 신호 제어 장치
|
7 |
7
교차로 학습부 및 네트워크 학습부를 포함하는 교통 신호 제어 장치에 의한 교통 신호 제어 방법에 있어서, 입력되는 이동류별 통과 교통량과 이동류별 초기 대기 행렬을 기반으로 교통 상황을 모사하여 제1 스테이트를 상기 교차로 학습부로 출력하는 단계와;상기 제1 스테이트를 기반으로 배리어간 녹색 시간 조정 비율과 상충현시간 녹색 시간 조정 비율을 제1 액션으로 학습하는 단계와;상기 제1 액션을 기반으로 상기 교통 상황을 다시 모사하여 상기 제1 스테이트를 갱신하는 단계와;상기 제1 액션으로 인하여 교차로 지체가 감소되면 상기 제1 액션을 보상하는 단계와;상기 제1 스테이트, 상기 제1 액션 및 상기 보상을 기반으로 최적의 교차로 신호 제어 변수를 도출하고, 도출된 상기 교차로 신호 제어 변수를 교통 신호 네트워크에 적용하는 단계를 포함하는 것을 특징으로 하는 교통 신호 제어 방법
|
8 |
8
제7항에 있어서, 입력되는 이동류별 통과 교통량과 이동류별 초기 대기 행렬을 기반으로 교통 상황을 모사하여 제2 스테이트를 상기 네트워크 학습부로 출력하는 단계와;상기 제2 스테이트를 기반으로 교차로별 옵셋 조정 비율과 교차로별 옵셋을 제2 액션으로 학습하는 단계와;상기 제2 액션을 기반으로 상기 교통 상황을 다시 모사하여 상기 제2 스테이트를 갱신하는 단계와;상기 제2 액션으로 인하여 네트워크 지체가 감소되면 상기 제2 액션을 보상하는 단계와;상기 제2 스테이트, 상기 제2 액션 및 상기 보상을 기반으로 최적의 네트워크 신호 제어 변수를 도출하고, 도출된 상기 네트워크 신호 제어 변수를 교통 신호 네트워크에 적용하는 단계를 더 포함하는 것을 특징으로 하는 교통 신호 제어 방법
|
9 |
9
제8항에 있어서,상기 제1 스테이트는 현시이동류별 공간 점유률, 현시이동류별 녹색시간 비율, 교차로 평균 제어 지체 및 현시별 포화도 중 적어도 하나를 포함하고, 상기 제2 스테이트는 제어 교차로 간 구간 평균 제어 지체 및 교차로별 옵셋을 포함하고,상기 교차로 신호 제어 변수는 현시별 녹색 시간를 포함하고, 상기 네트워크 신호 제어 변수는 신호 변화 주기, 및 교차로 옵셋을 포함하는 것을 특징으로 하는 교통 신호 제어 방법
|
10 |
10
메모리; 및 상기 메모리를 제어하는 프로세서를 포함하고,상기 프로세서는,입력되는 이동류별 통과 교통량과 이동류별 초기 대기 행렬을 기반으로 교통 상황을 모사하여 제1 스테이트를 출력하고, 상기 제1 스테이트를 기반으로 배리어간 녹색 시간 조정 비율과 상충현시간 녹색 시간 조정 비율을 제1 액션으로 학습하고, 상기 제1 액션을 기반으로 상기 교통 상황을 다시 모사하여 상기 제1 스테이트를 갱신하는 제어 장치
|