1 |
1
캐릭터 현재 동작 상태 및 샘플링 시간을 고려한 시스템 동역학을 정의하는 단계; 상기 시스템 동역학에 기반하여 현재 시간 윈도우에 대한 참고 동작을 추적하기 위한 최적 제어 문제를 정형화하는 단계; iLQG(iterative Linear Quadratic Gaussian)를 통해 상기 최적 제어 문제를 해독하여, 최적 제어 시퀸스, 최적 상태 시퀀스 및 최적 이득 행렬 시퀀스로 구성되는 최적 제어 정책을 생성하는 단계; 상기 최적 제어 정책을 기반으로 상기 현재 동작 상태와 상기 샘플링 시간에 대한 피드백 관절 토크와 피드백 샘플링 시간 증분을 산출하는 단계; 및상기 캐릭터에 인가되는 외력을 파악하고, 상기 외력을 상기 피드백 관절 토크 및 상기 피드백 샘플링 시간 증분과 함께 고려하여, 상기 현재 동작 상태와 상기 샘플링 시간을 갱신하는 단계를 포함하되, 상기 현재 동작 상태와 상기 샘플링 시간을 갱신하는 단계는상기 외력이 캐릭터 진행 방향으로 인가되는 경우에는 상기 샘플링 시간을 상기 외력에 비례하여 가속시키고, 상기 외력이 캐릭터 진행 반대 방향으로 인가되는 경우에는 상기 샘플링 시간의 흐름을 상기 외력에 비례하여 감속시킨 후 점진적으로 가속시키는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
2 |
2
제1항에 있어서, 상기 시스템 동역학을 정의하는 단계는캐릭터 현재 동작 상태 및 샘플링 시간을 기반으로 상태 벡터를 정의하고, 관절 토크 및 샘플링 시간 증분을 기반으로 제어 벡터를 정의하는 단계; 및시스템 동역학을 통해 현재 시간 스텝에서의 상태 벡터와 제어 벡터에 대응되는 다음 시간 스텝에서의 상태 벡터를 계산하는 단계;를 포함하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
3 |
3
제2항에 있어서, 상기 시스템 동역학을 정의하는 단계는상기 다음 시간 스텝에서의 상태 벡터()를 시스템 동역학에 의해 ""의 식에 따라 계산하며,상기 은 현재 시간 스텝에서의 관절 속도, 상기 은 다음 시간 스텝에서의 관절 속도, 상기 h는 시뮬레이션 시간 스텝의 크기, 상기 는 현재 시간 스텝에서의 참조 동작에 대한 샘플링 시간이고, 상기 는 현재 시간 스텝에서의 참조 동작에 대한 샘플링 시간 증분을 의미하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
4 |
4
제3항에 있어서, 상기 시스템 동역학을 정의하는 단계는""의 식을 정의한 후, 캐릭터 동작을 표현하기 위한 관절체 동역학을 통해 상기 을 산출하며, 상기 M은 기본 질량 행렬, 상기 b는 바이어스 힘, 상기 B는 관절 속도에 대한 감쇄 행렬, 상기 J는 다수개 접촉 지점에 대한 기구학적 자코비안, 는 각 접촉 지점에서의 접촉 충격량을 의미하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
5 |
5
제4항에 있어서, 상기 시스템 동역학을 정의하는 단계는상기 를 관절체 동역학이 미분 가능하도록 만드는 완화된 접촉 동역학을 통해 산출하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
6 |
6
제1항에 있어서, 상기 최적 제어 문제를 정형화하는 단계는상기 최적 제어 문제를 ""의 식으로 정형화하며, 상기 시간 스텝 i=1,2,…,N-1에서의 비용 함수이고, 상기 은 마지막 시간 스텝에서의 비용 함수이고, 상기 N는 시간 윈도우를 구성하는 프레임 개수이고, 상기 x는 상태 벡터이고, 상기 u는 제어 벡터인 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
7 |
7
제6항에 있어서, 상기 최적 제어 문제를 정형화하는 단계는상기 를 ""의 식으로 정의하고, 상기 는 참조 동작을 추적하기 위한 항이고, 상기 는 캐릭터의 균형 유지를 위해 전역 좌표계에서 캐릭터의 상체 기울기를 참조 동작의 상체 기울기에 맞추기 위한 항이고, 상기 는 와 함께 캐릭터의 균형 유지를 위해 전역 좌표계에서 캐릭터의 발 위치를 참조 동작의 발 위치에 맞추기 위한 항이고, 상기 ct(ui)은 샘플링 시간 증분 Δtis 또는 샘플링 시간 tis을 각각의 목표 값 와 으로 유도하기 위한 항이고, 상기 ce(ui)은 에너지 소모를 최소화시키기 위한 항인 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
8 |
8
제7항에 있어서, 상기 최적 제어 문제를 정형화하는 단계는마지막 시간 스텝 N에서의 비용 함수인 상기 는 , 상기 , 상기 의 합으로 구성되나, 마지막 시간 스텝 N에는 제어 벡터가 정의되어 있지 않음을 고려하여 상기 의 참조 관절 속도()를 로 근사하며, 상기 는 샘플링 시간 tsi에 대한 참조 동작이고, 상기 은 마지막 시간 스텝 N 직전에 획득된 d(d는 자연수)개의 제어 벡터들의 샘플링 시간 증분의 평균인 것을 특징으로 기반한 온라인 궤적 최적화 방법
|
9 |
9
제6항에 있어서, 상기 최적 제어 정책을 생성하는 단계는최적 값 함수를 ""의 식으로 정의하는 단계;상기 최적 값 함수를 "" 의 식으로 표현되는 재귀적인 형태로 변환한 후, 각 시간 스텝 i에서 최적화를 수행하는 단계; 및상기 최적화 결과를 기반으로, 최적 제어 시퀀스 , 최적 상태 시퀀스 및 최적 이득 행렬 시퀀스 로 구성된 최적 제어 정책을 생성하는 단계를 포함하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
10 |
10
제9항에 있어서, 상기 관절 토크와 샘플링 시간 증분을 산출하는 단계는시뮬레이션 시간 t ∈[]에서, 상기 최적 제어 정책과 상기 최적 상태 시퀀스를 기반으로 피드백 제어 백터를 산출하고, 상기 피드백 제어 백터로부터 상기 관절 토크와 상기 샘플링 시간 증분을 추출하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
11 |
11
제10항에 있어서, 상기 관절 토크와 샘플링 시간 증분을 산출하는 단계는상기 피드백 제어 백터를 ""의 식에 따라 산출하는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 방법
|
12 |
12
캐릭터의 현재 동작 상태, 참조 동작, 참조 동작에 대한 샘플링 시간이 입력 되면, DDP(Differential Dynamic Programming)를 통해 현재 시간 윈도우에 대한 최 적 제어 정책을 생성하는 궤적 최적화부;상기 최적 제어 정책 을 기반으로 상기 현재 동작 상태와 상기 샘플링 시간에 대한 피드백 관절 토크와 피드백 샘플링 시간 증분을 산출하는 피드백 제어부; 및상기 캐릭터에 인가되는 외력을 파 악하고, 상기 외력을 상기 피드백 관절 토크 및 상기 피드백 샘플링 시간 증분과 함께 고려하여, 상기 현재 동작 상태와 상기 샘플링 시 간을 갱신한 후 상기 궤적 최적화부에 전달하는 시뮬레이션부를 포함 하며, 상기 시뮬레이션부는상기 외력이 캐릭터 진행 방향으로 인가되는 경우에는 상기 샘플링 시간을 상기 외력에 비례하여 가속시키고, 상기 외력이 캐릭터 진행 반대 방향으로 인가되는 경우에는 상기 샘플링 시간의 흐름을 상기 외력에 비례하여 감속시킨 후 점진적으로 가속시키는 것을 특징으로 하는 자동 타임 워핑에 기반한 온라인 궤적 최적화 시스템
|