1 |
1
데이터를 저장하는 메모리;상기 메모리를 제어하는 프로세서;를 포함하되,상기 프로세서는 제어 대상 시스템으로부터 사건 메시지를 수신하고, 상기 사건 메시지에 상기 제어 대상 시스템의 대기행렬을 포함한 확률적 최적화에 필요한 정보를 반영하여 상태 메시지를 생성하고, 인공지능 시스템을 기반으로 상기 상태 메시지를 이용하여 제어 메시지를 산출하되,상기 제어 메시지는 상기 인공지능 시스템의 가치함수 혹은 정책함수와 상기 상태 메시지를 기반으로 산출되는, 인공지능 기반 확률적 최적화 장치
|
2 |
2
제1 항에 있어서,상기 프로세서는 상기 제어 메시지에 대한 상기 제어 대상 시스템의 응답 메시지를 수신하고, 상기 응답 메시지를 기반으로 상기 대기행렬을 업데이트하는, 인공지능 기반 확률적 최적화 장치
|
3 |
3
제2 항에 있어서,상기 응답 메시지는 상기 제어 메시지에 대한 비용 또는 벌칙, 상기 제어 대상 시스템의 제약조건 대상값, 상기 대기행렬에서 추가되는 작업의 양, 혹은 상기 대기행렬에서 삭제되는 작업의 양 중 적어도 하나를 포함하는, 인공지능 기반 확률적 최적화 장치
|
4 |
4
제2 항에 있어서,상기 대기행렬은 실제 대기행렬과 가상 대기행렬을 포함하는, 인공지능 기반 확률적 최적화 장치
|
5 |
5
제4 항에 있어서,상기 프로세서는 상기 업데이트된 대기행렬과 업데이트 전의 상기 대기행렬을 기반으로 보상 메시지를 생성하는, 인공지능 기반 확률적 최적화 장치
|
6 |
6
제5 항에 있어서,상기 보상 메시지는 상기 업데이트된 실제 대기행렬과 업데이트 전의 상기 실제 대기행렬의 차이와, 상기 업데이트된 가상 대기행렬과 업데이트 전의 상기 가상 대기행렬의 차이를 기반으로 생성되는, 인공지능 기반 확률적 최적화 장치
|
7 |
7
제6 항에 있어서,상기 보상 메시지는 상기 실제 대기행렬 간의 차이와 상기 가상 대기행렬 간의 차이를 기반으로 계산한 리야프노프 변동 및 응답 또는 벌칙값의 합으로 산출하는, 인공지능 기반 확률적 최적화 장치
|
8 |
8
제1 항에 있어서,상기 가치함수 혹은 상기 정책함수는 기계학습 모델을 사용한 근사화 함수 형태인, 인공지능 기반 확률적 최적화 장치
|
9 |
9
확률적 최적화 인터페이스에서 수행되는 인공지능 기반 확률적 최적화 방법에 있어서,제어 대상 시스템으로부터 사건 메시지를 수신하는 단계;상기 사건 메시지에 상기 제어 대상 시스템의 대기행렬을 포함한 확률적 최적화에 필요한 정보를 반영하여 상태 메시지를 생성하는 단계;인공지능 시스템을 기반으로 상기 상태 메시지를 이용하여 제어 메시지를 산출하는 단계;를 포함하되,상기 제어 메시지는 상기 인공지능 시스템의 가치함수 혹은 정책함수와 상기 상태 메시지를 기반으로 산출되는, 인공지능 기반 확률적 최적화 방법
|
10 |
10
제9 항에 있어서,상기 제어 메시지에 대한 상기 제어 대상 시스템의 응답 메시지를 수신하는 단계;를 더 포함하되, 상기 대기행렬은 상기 응답 메시지를 기반으로 업데이트되는, 인공지능 기반 확률적 최적화 방법
|
11 |
11
제10 항에 있어서,상기 응답 메시지는 상기 제어 메시지에 대한 비용, 상기 제어 대상 시스템의 제약 조건, 상기 대기행렬에서 추가되는 작업의 양, 혹은 상기 대기행렬에서 삭제되는 작업의 양 중 적어도 하나를 포함하는, 인공지능 기반 확률적 최적화 방법
|
12 |
12
제10 항에 있어서,상기 대기행렬은 실제 대기행렬과 가상 대기행렬을 포함하는, 인공지능 기반 확률적 최적화 방법
|
13 |
13
제12 항에 있어서,업데이트된 대기행렬과 업데이트 전의 상기 대기행렬을 기반으로 보상 메시지를 생성하는 단계;를 더 포함하는, 인공지능 기반 확률적 최적화 방법
|
14 |
14
제13 항에 있어서,상기 보상 메시지는 업데이트된 실제 대기행렬과 업데이트 전의 실제 대기행렬의 차이와, 업데이트된 가상 대기행렬과 업데이트 전의 가상 대기행렬의 차이를 기반으로 생성되는, 인공지능 기반 확률적 최적화 방법
|
15 |
15
제14 항에 있어서,상기 보상 메시지는 상기 실제 대기행렬 간의 차이와 상기 가상 대기행렬 간의 차이를 기반으로 계산한 리야프노프 변동 및 응답 또는 벌칙값의 합으로 산출하는, 인공지능 기반 확률적 최적화 방법
|
16 |
16
제10 항에 있어서,상기 가치함수 혹은 상기 정책함수는 기계학습 모델을 사용한 근사화 함수 형태인, 인공지능 기반 확률적 최적화 방법
|
17 |
17
인공지능 시스템에서 수행되는 인공지능 기반 확률적 최적화 방법에 있어서,제어 대상 시스템에 대해 상기 제어 대상 시스템의 대기행렬을 포함한 확률적 최적화에 필요한 정보를 기반으로 생성된 상태 메시지를 수신하는 단계;상기 인공지능 시스템의 가치함수 혹은 정책함수를 이용하여 상기 상태 메시지를 기반으로 행동 메시지를 생성하는 단계;상기 생성된 행동 메시지를 기반으로 생성된 보상 메시지를 수신하는 단계; 를 포함하되,상기 보상 메시지는 상기 행동 메시지를 기반으로 산출된 제어 메시지에 대한 응답이고, 상기 제어 메시지에 대한 상기 제어 대상 시스템의 상기 대기행렬을 업데이트하여 생성되는, 인공지능 기반 확률적 최적화 방법
|
18 |
18
제17 항에 있어서,상기 대기행렬은 실제 대기행렬과 가상 대기행렬을 포함하는, 인공지능 기반 확률적 최적화 방법
|
19 |
19
제17 항에 있어서,상기 보상 메시지는 업데이트된 대기행렬과 업데이트 전의 상기 대기행렬을 기반으로 생성되는, 인공지능 기반 확률적 최적화 방법
|
20 |
20
제17 항에 있어서,상기 보상 메시지는 상기 실제 대기행렬 간의 차이와 상기 가상 대기행렬 간의 차이를 기반으로 계산한 리야프노프 변동 및 응답 또는 벌칙값의 합으로 산출하는, 인공지능 기반 확률적 최적화 방법
|