1 |
1
게임의 실행 환경과 관련된 실행 환경 데이터 집합, 게임 캐릭터의 행동과 관련된 행동 데이터 집합, 및 상기 게임 캐릭터의 행동에 대한 보상 값과 관련된 보상 데이터 집합을 저장하는 데이터 저장부;상기 게임을 실행하는 경우, 상기 게임의 실행 환경에 따른 상기 게임 캐릭터의 행동에 대한 보상 값에 기초하여 상기 게임 캐릭터의 다음 행동을 학습하는 강화 학습 방법, 및 돌연변이 과정과 교배 과정에 기초하여 상기 게임 캐릭터의 다음 행동을 탐색하는 유전 알고리즘 중 적어도 하나를 선택하는 게임 환경 선택부; 및상기 강화 학습 방법 및 상기 유전 알고리즘 중 선택된 적어도 하나에 따른 상기 게임 캐릭터의 다음 행동에 대한 보상 값을 평가하고, 상기 평가된 보상 값에 기초하여 상기 보상 데이터 집합을 갱신하는 학습부를 포함하는 것을 특징으로 하는 게임 인공지능 시스템
|
2 |
2
제1항에 있어서,상기 게임 환경 선택부에 의해 상기 강화 학습 방법이 선택된 경우,상기 실행 환경 데이터 집합 중에서 어느 하나의 실행 환경 데이터를 임의로 선택하는 실행 환경 선택부; 및상기 보상 데이터 집합에 기초하여, 상기 행동 데이터 집합 중 상기 실행 환경 데이터에 대응되는 하나의 행동 데이터를 탐색하고, 상기 탐색된 행동 데이터를 상기 게임 캐릭터의 다음 행동으로 결정하는 다음 행동 결정부를 더 포함하는 것을 특징으로 하는 게임 인공지능 시스템
|
3 |
3
제2항에 있어서,상기 다음 행동 결정부는보상 값 비례 룰렛-휠 방식을 이용하여, 상기 행동 데이터 집합 중 상기 게임 캐릭터의 행동에 대한 보상 값이 가장 큰 행동 데이터를 탐색하는 것을 특징으로 하는 게임 인공지능 시스템
|
4 |
4
제1항에 있어서,상기 게임 환경 선택부에 의해 상기 유전 알고리즘이 선택된 경우,상기 실행 환경 데이터 집합 중에서 어느 하나의 실행 환경 데이터를 임의로 선택하는 실행 환경 선택부;상기 선택된 실행 환경 데이터의 일부 요소를 무작위 값으로 반복 치환하여 해당되는 각 실행 환경 데이터를 구성요소로 하는 실행 환경 데이터의 자식 집합을 생성하는 자식 집합 생성부; 및상기 행동 데이터 집합 중 상기 생성된 자식 집합 내 실행 환경 데이터에 대응되는 복수의 행동 데이터를 탐색하고, 상기 탐색된 행동 데이터 간의 교배 과정 및 돌연변이 과정을 통해 상기 게임 캐릭터의 다음 행동을 결정하는 다음 행동 결정부를 더 포함하는 것을 특징으로 하는 게임 인공지능 시스템
|
5 |
5
제4항에 있어서,상기 다음 행동 결정부는상기 교배 과정 및 돌연변이 과정을 거친 행동 데이터 중에서 룰렛-휠 방식을 이용하여 어느 하나의 행동 데이터를 선택함으로써 상기 게임 캐릭터의 다음 행동을 결정하는 것을 특징으로 하는 게임 인공지능 시스템
|
6 |
6
제1항에 있어서,상기 데이터 저장부는상기 실행 환경 데이터 집합, 상기 행동 데이터 집합, 및 상기 보상 데이터 집합 중 적어도 하나를 텍스트 파일로 저장하는 것을 특징으로 하는 게임 인공지능 시스템
|
7 |
7
제1항에 있어서,상기 학습부는상기 게임 캐릭터의 다음 행동에 따른 자신과 상대방의 피해 정도에 기초하여 상기 게임 캐릭터의 다음 행동에 대한 보상 값을 평가하는 것을 특징으로 하는 게임 인공지능 시스템
|
8 |
8
제1항에 있어서,상기 학습부는상기 게임 캐릭터의 다음 행동을 취하기 전과 후의 보상 값을 비교하고, 상기 비교 결과에 따라 상기 보상 데이터 집합 내 해당 보상 데이터의 값을 가감 처리하는 것을 특징으로 하는 게임 인공지능 시스템
|
9 |
9
게임 인공지능 시스템의 데이터 저장부에서, 게임의 실행 환경과 관련된 실행 환경 데이터 집합, 게임 캐릭터의 행동과 관련된 행동 데이터 집합, 및 상기 게임 캐릭터의 행동에 대한 보상 값과 관련된 보상 데이터 집합을 저장하는 단계;게임 인공지능 시스템의 게임 환경 선택부에서, 상기 게임을 실행하는 경우, 상기 게임의 실행 환경에 따른 상기 게임 캐릭터의 행동에 대한 보상 값에 기초하여 상기 게임 캐릭터의 다음 행동을 학습하는 강화 학습 방법, 및 돌연변이 과정과 교배 과정에 기초하여 상기 게임 캐릭터의 다음 행동을 탐색하는 유전 알고리즘 중 적어도 하나를 선택하는 단계;게임 인공지능 시스템의 학습부에서, 상기 강화 학습 방법 및 상기 유전 알고리즘 중 선택된 적어도 하나에 따른 상기 게임 캐릭터의 다음 행동에 대한 보상 값을 평가하는 단계; 및게임 인공지능 시스템의 학습부에서, 상기 평가된 보상 값에 기초하여 상기 보상 데이터 집합을 갱신하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
10 |
10
제9항에 있어서,상기 강화 학습 방법 및 상기 유전 알고리즘 중 적어도 하나를 선택하는 단계에서 상기 강화 학습 방법이 선택된 경우,게임 인공지능 시스템의 실행 환경 선택부에서, 상기 실행 환경 데이터 집합 중에서 어느 하나의 실행 환경 데이터를 임의로 선택하는 단계;게임 인공지능 시스템의 다음 행동 결정부에서, 상기 보상 데이터 집합에 기초하여, 상기 행동 데이터 집합 중 상기 실행 환경 데이터에 대응되는 하나의 행동 데이터를 탐색하는 단계; 및게임 인공지능 시스템의 다음 행동 결정부에서, 상기 탐색된 행동 데이터를 상기 게임 캐릭터의 다음 행동으로 결정하는 단계를 더 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
11 |
11
제10항에 있어서,상기 행동 데이터를 탐색하는 단계는보상 값 비례 룰렛-휠 방식을 이용하여, 상기 행동 데이터 집합 중 상기 게임 캐릭터의 행동에 대한 보상 값이 가장 큰 행동 데이터를 탐색하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
12 |
12
제9항에 있어서,상기 강화 학습 방법 및 상기 유전 알고리즘 중 적어도 하나를 선택하는 단계에서 상기 유전 알고리즘이 선택된 경우,게임 인공지능 시스템의 실행 환경 선택부에서, 상기 실행 환경 데이터 집합 중에서 어느 하나의 실행 환경 데이터를 임의로 선택하는 단계;게임 인공지능 시스템의 자식 집합 생성부에서, 상기 선택된 실행 환경 데이터의 일부 요소를 무작위 값으로 반복 치환하여 해당되는 각 실행 환경 데이터를 구성요소로 하는 실행 환경 데이터의 자식 집합을 생성하는 단계; 및게임 인공지능 시스템의 다음 행동 결정부에서, 상기 행동 데이터 집합 중 상기 생성된 자식 집합 내 실행 환경 데이터에 대응되는 복수의 행동 데이터를 탐색하고, 상기 탐색된 행동 데이터 간의 교배 과정 및 돌연변이 과정을 통해 상기 게임 캐릭터의 다음 행동을 결정하는 단계를 더 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
13 |
13
제12항에 있어서,상기 게임 캐릭터의 다음 행동을 결정하는 단계는상기 교배 과정 및 돌연변이 과정을 거친 행동 데이터 중에서 룰렛-휠 방식을 이용하여 어느 하나의 행동 데이터를 선택함으로써 상기 게임 캐릭터의 다음 행동을 결정하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
14 |
14
제9항에 있어서,상기 저장하는 단계는상기 실행 환경 데이터 집합, 상기 행동 데이터 집합, 및 상기 보상 데이터 집합 중 적어도 하나를 텍스트 파일로 저장하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
15 |
15
제9항에 있어서,상기 게임 캐릭터의 다음 행동에 대한 보상 값을 평가하는 단계는상기 게임 캐릭터의 다음 행동에 따른 자신과 상대방의 피해 정도에 기초하여 상기 게임 캐릭터의 다음 행동에 대한 보상 값을 평가하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|
16 |
16
제9항에 있어서,상기 보상 데이터 집합을 갱신하는 단계는상기 게임 캐릭터의 다음 행동을 취하기 전과 후의 보상 값을 비교하는 단계; 및상기 비교 결과에 따라 상기 보상 데이터 집합 내 해당 보상 데이터의 값을 가감 처리하는 단계를 포함하는 것을 특징으로 하는 게임 캐릭터의 인공지능 구현 방법
|