1 |
1
컴퓨터로 구현되는 학습 장치에 의해 각 단계가 수행되는 항공기의 제어를 위한 학습 방법에 있어서,제1 항공기와 제2 항공기 사이의 조준 각도를 특정 각도로 설정하는 단계;상기 특정 각도에 대응하여, 에피소드에 따른 입력에 기초하여 상기 제1 항공기의 동작을 제어하는 단계;상기 동작이 제어된 제1 항공기와 상기 제2 항공기 사이 관계 정보를 확인하는 단계;상기 관계 정보에 기초하여 상기 특정 각도에 대한 상기 에피소드의 리워드를 결정하는 단계; 복수의 에피소드 별 리워드의 평균이 기준 값 이상에 대응하도록 학습 모델을 학습시키는 단계; 및상기 특정 각도로 설정된 상기 조준 각도에서 상기 리워드의 평균이 상기 기준 값 이상에 대응하도록 상기 학습 모델이 학습된 경우, 상기 조준 각도를 단계적으로 재설정하여 상기 학습 모델을 단계적으로 재학습시키는 단계를 포함하고,상기 조준 각도를 특정 각도로 설정하는 단계는,상기 제1 항공기를 임의의 제1 롤 각도만큼 회전 시킨 후 특정 피치 각도만큼 회전시킨 후 임의의 제2 롤 각도만큼 추가적으로 회전 시키는 단계를 포함하는,항공기의 제어를 위한 학습 방법
|
2 |
2
제1항에 있어서,상기 조준 각도를 단계적으로 재설정하여 상기 학습 모델을 단계적으로 재학습시키는 단계는,복수의 에피소드 별 리워드의 평균이 상기 기준 값 이상에 대응하는 경우 상기 조준 각도를 기 설정된 각도만큼 증가된 다른 특정 각도로 재설정하고, 상기 재설정된 조준 각도에서 상기 학습 모델을 재학습시키는 단계를 포함하는,항공기의 제어를 위한 학습 방법
|
3 |
3
제1항에 있어서,상기 관계 정보는, 상기 제1 항공기와 상기 제2 항공기를 연결한 가상 선의 길이, 상기 제1 항공기와 상기 제2 항공기 사이의 측면 각도 및 상기 제1 항공기와 상기 제2 항공기 사이의 정면 교차 각도 중에서 적어도 하나를 포함하는,항공기의 제어를 위한 학습 방법
|
4 |
4
제3항에 있어서, 상기 리워드를 결정하는 단계는,상기 관계 정보에 기초하여 상기 제2 항공기가 상기 제1 항공기에 의한 격추 가능성을 분석하고, 상기 분석에 따라 기 설정된 서로 다른 리워드를 결정하는 단계를 포함하고, 상기 격추 가능성은,상기 가상 선의 길이, 상기 측면 각도 및 상기 정면 교차 각도에 기초하여 결정되는 것을 특징으로 하는,항공기의 제어를 위한 학습 방법
|
5 |
5
제1항에 있어서,상기 제1 항공기의 동작을 제어하는 단계는,상기 제1 항공기의 전면 추력, 상승 추력 및 롤(roll) 방향 회전 각도에 기초하여 상기 제1 항공기의 동작을 제어하는 단계를 포함하는,항공기의 제어를 위한 학습 방법
|
6 |
6
제2항에 있어서, 상기 조준 각도의 재설정은,상기 조준 각도가 180도에 대응할 때까지 상기 조준 각도를 상기 기 설정된 각도만큼 증가하도록 재설정하는 것을 특징으로 하는,항공기의 제어를 위한 학습 방법
|
7 |
7
제3항에 있어서,상기 조준 각도는,상기 제1 항공기의 진행 방향과 상기 가상 선 사이의 각도에 대응하는 것을 특징으로 하는,항공기의 제어를 위한 학습 방법
|
8 |
8
제3항에 있어서,상기 측면 각도는, 상기 제2 항공기의 진행 방향과 상기 가상 선 사이의 각도에 대응하며, 상기 정면 교차 각도는, 상기 제1 항공기의 진행 방향과 상기 제2 항공기의 진행 방향 사이의 각도에 대응하는 것을 특징으로 하는,항공기의 제어를 위한 학습 방법
|
9 |
9
비일시적 컴퓨터 판독 가능 저장 매체로서,컴퓨터 판독 가능 명령어들을 저장하도록 구성되는 매체를 포함하고,상기 컴퓨터 판독 가능 명령어들은 프로세서에 의해 실행되는 경우 상기 프로세서가:제1 항공기와 제2 항공기 사이의 조준 각도를 특정 각도로 설정하는 단계;상기 특정 각도에 대응하여, 에피소드에 따른 입력에 기초하여 상기 제1 항공기의 동작을 제어하는 단계;상기 동작이 제어된 제1 항공기와 상기 제2 항공기 사이 관계 정보를 확인하는 단계;상기 관계 정보에 기초하여 상기 특정 각도에 대한 상기 에피소드의 리워드를 결정하는 단계;복수의 에피소드 별 리워드의 평균이 기준 값 이상에 대응하도록 학습 모델을 학습시키는 단계; 및상기 특정 각도로 설정된 상기 조준 각도에서 상기 리워드의 평균이 상기 기준 값 이상에 대응하도록 상기 학습 모델이 학습된 경우, 상기 조준 각도를 단계적으로 재설정하여 상기 학습 모델을 단계적으로 재학습시키는 단계를 포함하고,상기 조준 각도를 특정 각도로 설정하는 단계는,상기 제1 항공기를 임의의 제1 롤 각도 만큼 회전 시킨 후 특정 피치 각도 만큼 회전시킨 후 임의의 제2 롤 각도 만큼 추가적으로 회전 시키는 단계를 포함하는 항공기의 제어를 위한 학습 방법을 수행하도록 하는, 비일시적 컴퓨터 판독 가능 저장 매체
|
10 |
10
적어도 하나의 명령어(instruction)를 저장하는 메모리; 및제1 항공기와 제2 항공기 사이의 조준 각도를 특정 각도로 설정하고, 상기 특정 각도에 대응하여 에피소드에 따른 입력에 기초하여 상기 제1 항공기의 동작을 제어하고, 상기 동작이 제어된 제1 항공기와 상기 제2 항공기 사이 관계 정보를 확인하고, 상기 관계 정보에 기초하여 상기 특정 각도에 대한 상기 에피소드의 리워드를 결정하고, 복수의 에피소드 별 리워드의 평균이 기준 값 이상에 대응하도록 학습 모델을 학습시키고, 상기 특정 각도로 설정된 상기 조준 각도에서 상기 리워드의 평균이 상기 기준 값 이상에 대응하도록 상기 학습 모델이 학습된 경우 상기 조준 각도를 단계적으로 재설정하여 상기 학습 모델을 단계적으로 재학습시키는 프로세서(processor)를 포함하고,상기 프로세서는, 상기 제1 항공기를 임의의 제1 롤 각도 만큼 회전 시킨 후 특정 피치 각도 만큼 회전시킨 후 임의의 제2 롤 각도 만큼 추가적으로 회전 시켜 상기 조준 각도를 상기 특정 각도로 설정하는 것을 특징으로 하는,학습 장치
|