1 |
1
강화학습을 이용한 HEMS 최적화 장치로서, 프로세서; 및상기 프로세서에 연결되는 메모리를 포함하되, 상기 메모리는, 미리 학습된 인공신경망을 기반으로 시간 t-1에서의 실내 온도, 사용자 선호 편의 온도의 상한/하한과 시간 t에서 예측된 외부 온도 및 에어컨의 에너지 소비량을 이용하여 현재 온도를 예측하고, 상기 예측된 현재 온도를 에어컨 에이전트를 위한 Q-러닝 모듈로 입력하고, 상기 예측된 현재 온도에 따라 상기 Q-러닝 모듈이 행동을 출력하는 경우 상기 예측된 현재 온도에 따른 한 쌍의 상태와 행동을 Q-값 테이블에 저장하여 업데이트하고, 상기 에어컨 에이전트와 차단 불가능 부하를 갖는 기기 및 차단 가능 부하를 갖는 기기에 상응하는 에이전트들 각각의 행동에 따른 보상의 합을 최대화하는 최적 정책을 탐색하도록, 상기 프로세서에 의해 실행 가능한 프로그램 명령어들을 저장하는 강화학습을 이용한 HEMS 최적화 장치
|
2 |
2
제1항에 있어서, 상기 차단 불가능 부하를 갖는 기기는 세탁기를 포함하며, 상기 차단 가능 부하를 갖는 기기는 에너지 저장 시스템을 포함하는 강화학습을 이용한 HEMS 최적화 장치
|
3 |
3
제2항에 있어서, 상기 세탁기의 에이전트는 온/오프 중 하나의 이진 행동을 수행하며, 상기 에어컨 및 에너지 저장 시스템의 에이전트는 단위 에너지 소비량의 차이를 갖는 복수의 레벨 중 하나의 행동을 수행하는 강화학습을 이용한 HEMS 최적화 장치
|
4 |
4
제1항에 있어서, 상기 인공신경망은 상기 에어컨의 에너지 소비량이 상기 현재 실내 온도에 영향을 미치는 정도를 학습하는 강화학습을 이용한 HEMS 최적화 장치
|
5 |
5
제1항에 있어서, 상기 인공신경망은 복수의 뉴런을 갖는 하나의 입력 데이터 레이어, 복수의 뉴런을 갖는 복수의 히든 레이어 및 하나의 뉴런을 갖는 출력 레이어로 구성되는 강화학습을 이용한 HEMS 최적화 장치
|
6 |
6
프로세서 및 메모리를 포함하는 장치에서 강화학습을 이용한 HEMS 최적화 방법으로서, 미리 학습된 인공신경망을 기반으로 시간 t-1에서의 실내 온도, 사용자 선호 편의 온도의 상한/하한과 시간 t에서 예측된 외부 온도 및 에어컨의 에너지 소비량을 이용하여 현재 온도를 예측하는 단계; 상기 예측된 현재 온도를 에어컨 에이전트를 위한 Q-러닝 모듈로 입력하는 단계; 상기 예측된 현재 온도에 따라 상기 Q-러닝 모듈이 행동을 출력하는 경우 상기 예측된 현재 온도에 따른 한 쌍의 상태와 행동을 Q-값 테이블에 저장하여 업데이트하는 단계; 및상기 에어컨 에이전트와 차단 불가능 부하를 갖는 기기 및 차단 가능 부하를 갖는 기기에 상응하는 에이전트들 각각의 행동에 따른 보상의 합을 최대화하는 최적 정책을 탐색하는 단계를 포함하는 강화학습을 이용한 HEMS 최적화 방법
|
7 |
7
제6항에 따른 방법을 수행하는 컴퓨터 판독 가능한 프로그램
|