1 |
1
제1 에너지 관리부; 및상기 제1 에너지 관리부와 통신 가능한 적어도 하나의 제2 에너지 관리부;를 포함하되,상기 적어도 하나의 제2 에너지 관리부는 수집한 데이터를 이용하여 관찰 데이터를 획득하고 획득한 관찰 데이터를 상기 제1 에너지 관리부로 전송하고,상기 제1 에너지 관리부는 상기 관찰 데이터를 기반으로 학습을 수행하여 전역적 신경망 매개 변수를 획득하고, 상기 신경망 매개 변수를 상기 제2 에너지 관리부로 전달하고,상기 적어도 하나의 제2 에너지 관리부는 상기 신경망 매개 변수 및 상기 수집한 데이터를 이용하여 학습을 수행하여 에너지 디스패치를 결정하는 에너지 관리 시스템
|
2 |
2
제1항에 있어서,상기 적어도 하나의 제2 에너지 관리부는, 상기 수집한 데이터를 기반으로 상태를 선택하고, 선택한 상기 상태를 기반으로 학습을 수행하여 행동 및 상기 행동에 대응하는 보상을 결정하고, 상기 행동 및 상기 보상을 상기 제1 에너지 관리부로 전송하는 에너지 관리 시스템
|
3 |
3
제2항에 있어서,상기 적어도 하나의 제2 에너지 관리부는, 가치 함수, 이익 함수 및 정책 기울기 중 적어도 하나를 추정하는 에너지 관리 시스템
|
4 |
4
제1항에 있어서,상기 적어도 하나의 제2 에너지 관리부는, 미리 정의된 타임 슬롯 동안 반복적으로 관찰 데이터를 획득하고, 상기 타임 슬롯이 종료되면 종료 시점에서의 관찰 데이터를 상기 제1 에너지 관리부로 전송하는 에너지 관리 시스템
|
5 |
5
제1항에 있어서,상기 제1 에너지 관리부는, 전역적 에너지 디스패치 정책을 결정하거나, 또는 정책 손실을 평가하는 에너지 관리 시스템
|
6 |
6
제1항에 있어서,상기 적어도 하나의 제2 에너지 관리부와 연결되고 외부의 장치와 통신을 수행하며 에너지를 소비하는 적어도 하나의 기지국부; 및상기 적어도 하나의 제2 에너지 관리부와 연결되고 대체 에너지를 생산하는 에너지 생성부; 중 적어도 하나를 포함하는 에너지 관리 시스템
|
7 |
7
제1항에 있어서,상기 제1 에너지 관리부는, 외부와의 통신 수행을 위해 에너지를 소비하는 적어도 하나의 기지국부 및 대체 에너지를 생산하는 에너지 생성부 중 적어도 하나와 연결되고, 상기 기지국부 및 상기 에너지 생성부 중 적어도 하나로부터 수집한 데이터를 이용하여 학습을 수행하고, 학습 수행에 따라 획득한 정보를 기반으로 학습을 수행하여 전역적 신경망 매개 변수를 획득하고, 상기 신경망 매개 변수를 이용하여 학습을 수행하여 에너지 디스패치를 결정하는 에너지 관리 시스템
|
8 |
8
외부의 에너지 관리 장치로부터 관찰 데이터를 수신하는 통신부;상기 관찰 데이터를 기반으로, 에너지 디스패치 정책의 결정에 관한 학습 알고리즘을 위한 최적화된 신경망 매개 변수를 획득하는 처리부;를 포함하되,상기 통신부는 상기 신경망 매개 변수를 상기 외부의 에너지 관리 장치로 전송하는 에너지 관리 장치
|
9 |
9
제8항에 있어서,상기 처리부는, 정책 손실 함수의 기울기를 평가하여 최적화된 신경망 매개 변수를 획득하는 에너지 관리 장치
|
10 |
10
에너지의 생산 및 수요에 관한 데이터를 수집하는 데이터 수집부;상기 데이터 수집부가 수집한 데이터를 기반으로 관찰 데이터를 획득하는 처리부; 및상기 관찰 데이터를 에너지 관리 장치로 전송하고, 상기 외부의 에너지 관리 장치로부터 신경망 매개 변수를 수신하는 통신부;를 포함하되,상기 처리부는 상기 신경망 매개 변수를 이용하여 학습을 수행하는 에너지 관리 장치
|
11 |
11
제10항에 있어서,상기 처리부는 상기 수집한 데이터를 이용하여 상태를 선택하고, 선택한 상태를 기반으로 학습을 수행하여 행동 및 상기 행동에 대응하는 보상을 결정하는 에너지 관리 장치
|
12 |
12
제10항에 있어서,상기 처리부는 미리 정의된 타임 슬롯 동안 반복적으로 상기 관찰 데이터를 획득하고,상기 통신부는 상기 타임 슬롯이 종료된 이후에 상기 관찰 데이터를 상기 외부의 관리 장치로 전송하는 에너지 관리 장치
|
13 |
13
제10항에 있어서,상기 처리부는 가치 함수, 이익 함수 및 정책 기울기 중 적어도 하나를 추정하는 에너지 관리 장치
|
14 |
14
에너지 수요 및 생산에 관하여 데이터를 수집하는 단계;상기 데이터를 기반으로 관찰 데이터가 획득되는 단계;상기 관찰 데이터를 이용하여 학습을 더 수행함으로써 복수의 에너지 관리 장치에 의해 이용되는 전역적 신경망 매개 변수가 획득되는 단계; 및상기 전역적 신경망 매개 변수 및 상기 수집한 데이터를 이용하여 학습을 더 수행함으로써, 각각의 에너지 관리 장치의 에너지 디스패치 정책이 결정되는 단계;를 포함하는 에너지 관리 방법
|
15 |
15
제14항에 있어서,상기 데이터를 기반으로 관찰 데이터가 획득되는 단계는, 상기 수집한 데이터를 기반으로 상태를 선택하는 단계; 및선택한 상기 상태를 기반으로 학습을 수행하여 행동 및 상기 행동에 대응하는 보상을 결정하는 단계;를 포함하는 에너지 관리 방법
|
16 |
16
제15항에 있어서,상기 데이터를 기반으로 관찰 데이터가 획득되는 단계는, 가치 함수, 이익 함수 및 정책 기울기 중 적어도 하나를 추정하는 단계;를 더 포함하는 에너지 관리 방법
|
17 |
17
제14항에 있어서,상기 에너지 수요 및 생산에 관하여 데이터를 수집하는 단계 및 상기 데이터를 기반으로 관찰 데이터가 획득되는 단계가, 미리 정의된 타임 슬롯 동안 계속해서 반복되는 단계;를 더 포함하는 에너지 관리 방법
|
18 |
18
제14항에 있어서,상기 에너지 수요 및 생산에 관하여 데이터를 수집하는 단계 및 상기 데이터를 기반으로 관찰 데이터가 획득되는 단계는 제2 장치에 의해 수행되고,상기 관찰 데이터를 이용하여 학습을 더 수행함으로써 복수의 에너지 관리 장치에 의해 이용되는 전역적 신경망 매개 변수가 획득되는 단계는, 상기 제2 장치와 상이한 제1 장치에 의해 수행되는 에너지 관리 방법
|
19 |
19
제18항에 있어서,상기 제2 장치가 상기 제1 장치로 상기 관찰 데이터를 전송하는 단계; 및 상기 제1 장치가 상기 제2 장치로 상기 전역적 신경망 매개 변수를 전송하는 단계;를 더 포함하는 에너지 관리 방법
|