1 |
1
차량의 현재 위치와 도착점 위치를 기반으로 하나 이상의 경로점을 포함하는 경로점 집합을 생성하는 경로점 집합 생성부;영상 센서로 획득한 영상 정보로부터 주행 불가능 영역을 식별하여 대체 경로점으로 상기 주행 불가능 영역에 있는 경로점을 대체하여 상기 경로점 집합을 갱신하는 입력 영상 처리부;상기 차량과 현재 추종하고 있는 경로점 간의 거리 차이 및 방향 차이를 포함하는 상대 벡터를 계산하는 상대 벡터 계산부; 및상기 영상 정보를 인코딩한 정보 및 상기 상대 벡터를 포함한 강화학습 자료를 신경망에 입력하는 강화학습 입력부를 포함하고,상기 신경망은 상기 영상 정보를 인코딩한 정보 및 상기 상대 벡터를 입력으로 사용하여 자율주행 강화학습을 수행하여 상기 차량의 제어 수치를 출력하는 강화학습 기반 자율 주행 장치
|
2 |
2
제1 항에 있어서,상기 경로점 집합 생성부는 상기 차량의 현재 위치에서 도착점까지 방문해야 하는 순서에 따라 경로점들을 정렬하여 상기 경로점 집합을 생성하는 강화학습 기반 자율 주행 장치
|
3 |
3
제1 항에 있어서,상기 차량의 현재 위치와 현재 추종하고 있는 경로점의 위치의 거리차가 일정 수치 이내인 경우 추종 경로점을 상기 현재 추종하고 있는 경로점의 다음 경로점으로 갱신하는 추종 경로점 갱신부를 더 포함하는 강화학습 기반 자율 주행 장치
|
4 |
4
제3 항에 있어서,상기 입력 영상 처리부는 상기 영상 정보로부터 상기 추종 경로점의 추종 가능 여부를 확인한 후 추종 불가능시 대체 경로점을 생성하여 상기 추종 경로점을 갱신하는 강화학습 기반 자율 주행 장치
|
5 |
5
제1 항에 있어서,상기 상대 벡터 계산부는 상기 차량의 현재 위치와 상기 현재 추종하고 있는 경로점 간의 벡터 방향을 구하고, 상기 차량의 헤딩과 상기 벡터 방향 간의 각도 차이를 구하여 상기 상대 벡터를 생성하는 강화학습 기반 자율 주행 장치
|
6 |
6
차량의 현재 위치와 도착점 위치를 기반으로 하나 이상의 경로점을 포함하는 경로점 집합을 생성하는 단계;영상 센서로 획득한 영상 정보로부터 주행 불가능 영역을 식별하여 대체 경로점으로 상기 주행 불가능 영역에 있는 경로점을 대체하여 상기 경로점 집합을 갱신하는 단계;상기 차량과 현재 추종하고 있는 경로점 간의 거리 차이 및 방향 차이를 포함하는 상대 벡터를 계산하는 단계; 및상기 영상 정보를 인코딩한 정보 및 상기 상대 벡터를 포함한 강화학습 자료를 신경망에 입력하는 단계를 포함하고,상기 신경망은 상기 영상 정보를 인코딩한 정보 및 상기 상대 벡터를 입력으로 사용하여 자율주행 강화학습을 수행하여 상기 차량의 제어 수치를 출력하는 강화학습 기반 자율 주행 방법
|
7 |
7
제6 항에 있어서,상기 차량의 현재 위치와 현재 추종하고 있는 경로점의 위치의 거리차가 일정 수치 이내인 경우 추종 경로점을 상기 현재 추종하고 있는 경로점의 다음 경로점으로 갱신하는 단계를 더 포함하는 강화학습 기반 자율 주행 방법
|
8 |
8
제7 항에 있어서,상기 영상 정보로부터 상기 추종 경로점의 추종 가능 여부를 확인한 후 추종 불가능시 대체 경로점을 생성하여 상기 추종 경로점을 갱신하는 단계를 더 포함하는 강화학습 기반 자율 주행 방법
|
9 |
9
제6 항에 있어서,상기 경로점 집합은 상기 차량의 현재 위치에서 도착점까지 방문해야 하는 순서에 따라 경로점들을 정렬하여 생성되는 강화학습 기반 자율 주행 방법
|
10 |
10
제6 항에 있어서,상기 상대 벡터를 계산하는 단계는,상기 차량의 현재 위치와 상기 현재 추종하고 있는 경로점 간의 벡터 방향을 구하고, 상기 차량의 헤딩과 상기 벡터 방향 간의 각도 차이를 구하는 단계를 포함하는 강화학습 기반 자율 주행 방법
|
11 |
11
제6 항에 있어서,상기 신경망이 상기 강화학습 자료와 무관한 주행 성능 척도로 정의되는 제1 보상과 상기 강화학습 자료와 연관된 주행 성능 척도로 정의되는 제2 보상을 각 스텝마다 수여하는 단계를 더 포함하는 강화학습 기반 자율 주행 방법
|
12 |
12
제11 항에 있어서,상기 제2 보상은 상기 상대 벡터의 방향 차이의 절대값과 관련된 보상 및 상기 상대 벡터의 거리 차이와 관련된 보상을 포함하는 강화학습 기반 자율 주행 방법
|