1 |
1
강화학습 시스템 상의 개체 포팅(porting) 방법에 있어서,프록시가 에이전트 인터페이스로부터 사건 개시 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 개체 인터페이스로 전달하는 단계;상기 프록시가 상기 개체 인터페이스로부터 제1 관찰 정보를 포함한 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계;상기 프록시가 상기 에이전트 인터페이스로부터 행동 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스로 전달하는 단계; 및상기 프록시가 상기 개체 인터페이스로부터 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계;를 포함하는, 개체 포팅 방법
|
2 |
2
제1항에 있어서,상기 제1 동기화는,개체의 사건 진행 시 에이전트의 동작을 멈추고 대기시키는 동기화인, 개체 포팅 방법
|
3 |
3
제2항에 있어서,상기 수신한 메시지를 제1 동기화에 기초하여 개체 인터페이스로 전달하는 단계들은,상기 프록시가 상기 에이전트 인터페이스에게 제1 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 방법
|
4 |
4
제1항에 있어서,상기 제2 동기화는 에이전트의 의사 결정 시 개체의 사건 진행을 멈추고 대기시키는 동기화인, 개체 포팅 방법
|
5 |
5
제4항에 있어서,상기 수신한 메시지를 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는 단계들은,상기 프록시가 상기 개체 인터페이스에게 제2 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 방법
|
6 |
6
제1항에 있어서,상기 프록시가 메시지 수신 시 필요한 경우에 수신한 메시지에 기초하여 내부 동작 파라미터를 업데이트하는 단계를 더 포함하는, 개체 포팅 방법
|
7 |
7
제1항에 있어서,상기 프록시가 개체 인터페이스 또는 에이전트 인터페이스에게 전달하는 메시지들은,상기 프록시가 수신한 메시지들이 전달한 파라미터 및 상기 프록시가 수신한 메시지들에 기초하여 새로 생성한 파라미터를 포함하는, 개체 포팅 방법
|
8 |
8
제1항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 초기화 정보를 포함하는 메시지를 수신하는 단계;상기 프록시가 상기 초기화 정보를 포함하는 메시지에 기초하여 필요한 경우 파라미터를 초기화하는 단계; 상기 프록시가 상기 개체 인터페이스에게 상기 초기화 정보를 포함하는 메시지를 전달하는 단계; 및상기 프록시가 상기 개체 인터페이스로부터 초기화 응답 정보를 포함하는 메시지를 수신하고, 에이전트 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
|
9 |
9
제1항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 종료 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
|
10 |
10
제9항에 있어서,상기 프록시가 상기 개체 인터페이스로부터 종료 응답 정보를 포함하는 메시지를 수신하고, 상기 에이전트 인터페이스에게 전달하는 단계;를 더 포함하는, 개체 포팅 방법
|
11 |
11
강화학습 시스템 상의 개체 포팅(porting) 장치에 있어서,에이전트 인터페이스; 프록시; 및개체 인터페이스;를 포함하고,상기 프록시가 상기 에이전트 인터페이스로부터 사건 개시 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 개체 인터페이스로 전달하며,상기 프록시가 상기 개체 인터페이스로부터 제1 관찰 정보를 포함한 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하되,상기 프록시가 상기 에이전트 인터페이스로부터 행동 정보를 포함하는 메시지를 수신하고, 제1 동기화에 기초하여 상기 개체 인터페이스로 전달하고,상기 프록시가 상기 개체 인터페이스로부터 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하고, 제2 동기화에 기초하여 상기 에이전트 인터페이스로 전달하는, 개체 포팅 장치
|
12 |
12
제11항에 있어서,상기 제1 동기화는,개체의 사건 진행 시 에이전트의 동작을 멈추고 대기시키는 동기화인, 개체 포팅 장치
|
13 |
13
제12항에 있어서,상기 제1 동기화에 기초한 개체 인터페이스로 전달들은,상기 프록시가 상기 에이전트 인터페이스에게 제1 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 장치
|
14 |
14
제11항에 있어서,상기 제2 동기화는 에이전트의 의사 결정 시 개체의 사건 진행을 멈추고 대기시키는 동기화인, 개체 포팅 장치
|
15 |
15
제14항에 있어서,상기 제2 동기화에 기초한 상기 에이전트 인터페이스로 전달들은,상기 프록시가 상기 개체 인터페이스에게 제2 동기화 정보를 포함하는 메시지 전달을 포함하는, 개체 포팅 장치
|
16 |
16
제11항에 있어서,상기 프록시가 메시지 수신 시 필요한 경우에 수신한 메시지에 기초하여 내부 동작 파라미터를 업데이트하는, 개체 포팅 장치
|
17 |
17
제11항에 있어서,상기 프록시가 상기 개체 인터페이스 또는 상기 에이전트 인터페이스에게 전달하는 메시지들은,상기 프록시가 수신한 메시지들이 전달한 파라미터 및 상기 프록시가 수신한 메시지에 기초하여 새로 생성한 파라미터를 포함하는, 개체 포팅 장치
|
18 |
18
제11항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 초기화 정보를 포함하는 메시지를 수신하고,상기 프록시가 상기 초기화 정보를 포함하는 메시지에 기초하여 필요한 경우 파라미터를 초기화하며, 상기 프록시가 상기 개체 인터페이스에게 상기 초기화 정보를 포함하는 메시지를 전달하되, 상기 프록시가 상기 개체 인터페이스로부터 초기화 응답 정보를 포함하는 메시지를 수신하고, 상기 에이전트 인터페이스에게 전달하는, 개체 포팅 장치
|
19 |
19
제11항에 있어서,상기 프록시가 상기 에이전트 인터페이스로부터 종료 정보를 포함하는 메시지를 수신하고 제1 동기화에 기초하여 상기 개체 인터페이스에게 전달하되,상기 프록시가 개체 인터페이스로부터 종료 응답 정보를 포함하는 메시지를 수신하고 에이전트 인터페이스에게 전달하는, 개체 포팅 장치
|
20 |
20
강화학습 시스템 상의 개체 포팅(porting) 장치에 있어서,에이전트 인터페이스; 프록시; 및개체 인터페이스;를 포함하고,상기 에이전트 인터페이스가 상기 프록시로 사건 개시 정보를 포함하는 메시지를 전달하고, 상기 개체 인터페이스는 상기 프록시로부터 제1 동기화에 기초하여 상기 사건 개시 정보를 포함하는 메시지를 수신하며,상기 개체 인터페이스가 상기 프록시로 제1 관찰 정보를 포함한 메시지를 전달하고, 상기 에이전트 인터페이스는 상기 프록시로부터 제2 동기화에 기초하여 상기 제1 관찰 정보를 포함한 메시지를 수신하되,상기 에이전트 인터페이스가 상기 프록시로 행동 정보를 포함하는 메시지를 전달하고, 상기 개체 인터페이스는 제1 동기화에 기초하여 상기 프록시로부터 상기 행동 정보를 포함하는 메시지를 수신하고,상기 개체 인터페이스가 상기 프록시로 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 전달하고, 상기 에이전트 인터페이스가 상기 프록시로부터 제2 동기화에 기초하여 상기 제2 관찰 정보 및 보상 정보를 포함하는 메시지를 수신하는, 개체 포팅 장치
|