1 |
1
컴퓨터 장치가 시점 t에서의 캐릭터의 상태 정보를 획득하는 단계;상기 컴퓨터 장치가 상기 상태 정보를 사전에 구축한 신경망 모델에 입력하여 액션 정보를 생성하는 단계; 및상기 컴퓨터 장치가 상기 시점 t에서의 상기 액션 정보를 상기 캐릭터 또는 상기 캐릭터의 동작을 출력하는 장치에 전달하는 단계를 포함하되,상기 신경망 모델은 캐릭터의 보행 동작 상태를 포함하는 상기 상태 정보를 입력받아 강화 학습의 보상을 최대화하는 행동 정보를 결정하는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
2 |
2
제1항에 있어서,상기 상태 정보는 상기 캐릭터에 특이적인 보행 동작 파라미터 및 스윙하는 다리의 식별자를 더 포함하고, 상기 보행 동작 파라미터는 상기 캐릭터의 걸음의 길이, 걸음의 소요 시간 및 스윙하는 발의 최대 높이를 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
3 |
3
제1항에 있어서,상기 액션 정보는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대한 정보로 구성되고, 상기 액션 정보는 보행 동작을 정의하는 다리 관절들의 특정 각도를 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
4 |
4
제1항에 있어서,상기 신경망 모델은 보행 동작을 정의하는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대하여 보행 동작을 정의하는 복수의 관절 부위의 회전 가용 범위를 기준으로 액션 정보를 출력하도록 학습되는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
5 |
5
제1항에 있어서,상기 보상은 캐릭터에 대한 현재 보행 파리미터와 목표 보행 파라미터의 편차 교정, 캐릭터가 서 있는 상태를 유지하도록 교정, 캐릭터의 목표 진행 방향으로의 교정 및 보행에 관여하는 관절들의 토크값을 기준값 이하로 교정하는 항목을 포함하는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
6 |
6
제1항에 있어서,상기 신경망 모델은 상기 캐릭터가 특정 시점에서 한 걸음에 소요되는 시간을 기준으로 조절된 상기 보상을 기준으로 학습되는 강화학습모델을 이용한 보행 동작 정보 출력 방법
|
7 |
7
시점 t에서의 캐릭터의 동작 정보를 입력받는 입력장치;캐릭터의 보행에 대한 상태 정보를 기준으로 액션 정보를 출력하는 신경망 모델을 저장하는 저장장치; 및상기 동작 정보를 포함하는 상태 정보를 상기 신경망 모델에 입력하여 액션 정보를 출력하고, 상기 출력된 액션 정보를 기준으로 상기 시점 t에서 상기 캐릭터의 보행 동작을 위한 제어 정보를 생성하는 연산장치를 포함하되, 상기 신경망 모델은 캐릭터의 보행 동작 상태를 포함하는 상기 상태 정보를 입력받아 강화 학습의 보상을 최대화하는 액션 정보를 결정하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|
8 |
8
제7항에 있어서,상기 상태 정보는 상기 캐릭터에 특이적인 보행 동작 파라미터 및 스윙하는 다리의 식별자를 더 포함하고, 상기 보행 동작 파라미터는 상기 캐릭터의 걸음의 길이, 걸음의 소요 시간 및 스윙하는 발의 최대 높이를 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|
9 |
9
제7항에 있어서,상기 액션 정보는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대한 정보로 구성되고, 상기 액션 정보는 보행 동작을 정의하는 다리 관절들의 특정 각도를 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|
10 |
10
제7항에 있어서,상기 신경망 모델은 보행 동작을 정의하는 스윙 업(swing up) 상태와 스윙 다운(swing down) 상태 각각에 대하여 보행 동작을 정의하는 복수의 관절 부위의 회전 가용 범위를 기준으로 액션 정보를 출력하도록 학습되는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|
11 |
11
제7항에 있어서,상기 보상은 캐릭터에 대한 현재 보행 파리미터와 목표 보행 파라미터의 편차 교정, 캐릭터가 서 있는 상태를 유지하도록 교정, 캐릭터의 목표 진행 방향으로의 교정 및 보행에 관여하는 관절들의 토크값을 기준값 이하로 교정하는 항목을 포함하는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|
12 |
12
제7항에 있어서,상기 신경망 모델은 상기 캐릭터가 특정 시점에서 한 걸음에 소요되는 시간을 기준으로 조절된 상기 보상을 기준으로 학습되는 강화학습모델 기반으로 캐릭터의 보행 동작을 결정하는 서비스 장치
|