1 |
1
(a) 시연자의 시연 정보와 모방 학습을 통해 로봇이 초기 모터 스킬을 학습하는 단계; 및(b) 강화 학습을 통해 로봇의 초기 모터 스킬을 향상시키고 일반화하는 단계;를 포함하는, 로봇용 학습 프레임워크 설정방법
|
2 |
2
제1항에 있어서,상기 로봇용 학습 프레임워크 설정방법은, 로봇의 모터 스킬을 학습, 개선 및 일반화하기 위해 펙인홀(Peg-In-Hole) 작업에서 홀-탐색(hole-serch) 모터 스킬 및 펙-삽입(peg-insert) 모터 스킬에 프레임워크를 적용하는, 로봇용 학습 프레임워크 설정방법
|
3 |
3
제2항에 있어서,상기 (a) 단계에서는,(a-1) 물리적 상호작용에 의해 발생하는 반발력 및 반발토크를 모델링하기 위하여 시연자의 시연 정보를 은닉 마르코프 모델(hidden Markov models)로 모델링하는 단계;(a-2) 상황에 적합한 로봇 행동 생성을 위하여 작업을 수행하도록 로봇 제어를 위한 동적 행동 프리미티브 모델(dynamic movement primitives models)로 모델링하는 단계; 및(a-3) 상기 은닉 마르코프 모델과 상기 동적 행동 프리미티브 모델을 하나의 초기 모터 스킬로 결합하는 단계;를 포함하는, 로봇용 학습 프레임워크 설정방법
|
4 |
4
제3항에 있어서,상기 (a) 단계에서는 상기 은닉 마르코프 모델을 통해 반발력 신호 및 반발토크 신호를 인식하고, 상기 동적 행동 프리미티브 모델을 통해 시연자의 시연에 해당하는 모션 경로를 생성하기 위하여 상기 은닉 마르코프 모델 및 상기 동적 행동 프리미티브 모델의 파라미터를 결합시키는, 로봇용 학습 프레임워크 설정방법
|
5 |
5
제4항에 있어서,상기 (a-1) 단계에서는, 작업에 부적합한 반발력 신호 및 반발토크 신호를 제거하기 위하여 로봇은 일련의 시연에 기초한 자기 재현을 통해 작업에 적합한 반발력 신호 및 반발토크 신호 및 해당 제어 신호를 추출하는, 로봇용 학습 프레임워크 설정방법
|
6 |
6
제5항에 있어서,상기 (a-1) 단계에서는, 물리적 상호작용을 인식하기 위하여 펙을 기울여 홀을 탐색하는 틸트 서치 모션, 펙을 홀의 제1 지점에 접촉시키는 싱글 포인트 컨택 모션, 펙을 홀의 제1 지점 및 제2 지점에 접촉시키는 투 포인트 컨택 모션, 펙을 기울여 펙과 홀을 정렬시키는 정렬 모션, 및 펙을 홀에 밀어넣는 푸시 모션을 포함하는, 로봇용 학습 프레임워크 설정방법
|
7 |
7
제2항에 있어서,상기 홀-탐색(hole-serch) 모터 스킬은 펙과 홀의 부정확한 현재 위치를 기준으로 홀이 있는 방향을 찾는 동작인, 로봇용 학습 프레임워크 설정방법
|
8 |
8
제2항에 있어서,상기 펙-삽입(peg-insert) 모터 스킬은 홀 방향에 따라 홀에 펙을 삽입하는 동작인, 로봇용 학습 프레임워크 설정방법
|
9 |
9
제3항에 있어서,상기 (b) 단계는,(b-1) 상기 은닉 마르코프 모델을 사용하여 최대 가능성을 갖는 초기 모터 스킬을 선택하는 단계;(b-2) 강화학습을 통해 해당 동적 행동 프리미티브 모델의 파리미터를 재평가하는 단계; 및(b-3) 재평가된 동적 행동 프리미티브 모델에 의해 생성된 모션 경로로부터 상기 은닉 마르코프 모델의 파라미터를 재평가하는 단계;를 포함하는, 로봇용 학습 프레임워크 설정방법
|
10 |
10
제9항에 있어서,상기 (b) 단계에서는 모터 스킬을 개선하고 일반화하기 위한 새로운 보상 기능을 설계하여 실행 시간 스텝이나 시간을 줄이고 반환 알고리즘으로 탐색을 가중시켜 정책 학습의 확장에 기초하여 모션 경로를 최적화하는, 로봇용 학습 프레임워크 설정방법
|
11 |
11
제10항에 있어서,상기 (b) 단계에서는 반환을 통한 탐색 가중에 따른 정책 학습 알고리즘을 이용하여 해당 정책 파라미터에서 롤아웃의 예상 반환값을 최대화하는 정책 파라미터를 추정하는, 로봇용 학습 프레임워크 설정방법
|
12 |
12
제10항에 있어서상기 (b) 단계에서는 개선 및 일반화 과정을 구분하기 위하여 상기 은닉 마르코프 모델로부터 생성된 임계값 모델을 사용하는, 로봇용 학습 프레임워크 설정방법
|
13 |
13
제1항 내지 제12항 중 어느 한 항의 로봇용 학습 프레임워크 설정방법을 수행하는 디지털 제어 장치
|
14 |
14
제1항 내지 제12항 중 어느 한 항의 로봇용 학습 프레임워크 설정방법이 기록된 컴퓨터 판독 가능한 저장 매체
|