1 |
1
Q-학습(Q-learning)기반의 사이클로트론용 PIG 이온원 제어시스템에 있어서, 소정의 가스를 입력받아 이온빔을 출력하는 상기 PIG(Penning Ion Gauge) 이온원;소정의 가스를 상기 PIG 이온원쪽으로 출력하는 가스 주입부;상기 가스 주입부로부터 출력된 가스를 입력받고, 상기 PIG 이온원으로 유입되는 가스량을 제어하여, 상기 PIG 이온원에 출력하는 가스 출력량 컨트롤러; 상기 PIG 이온원에 전류를 공급하는 파워 서플라이;상기 PIG 이온원에서 출력된 이온빔 전류를 측정하는 제1 패러데이 컵;상기 PIG 이온원으로 되돌아오는 암전류를 측정하는 제2 패러데이 컵;상기 암전류, 상기 이온빔 전류, 상기 파워 서플라이 출력전류, 상기 가스 출력량을 기반으로 상기 Q-학습(Q-learning)을 통해, 상기 PIG 이온원에서 출력되는 이온빔 전류와 암전류를 제어하기 위해 상기 파워 서플라이 전류와 상기 가스 출력량을 제어하는 제어장치를 포함하는 Q-학습(Q-learning)기반의 사이클로트론용 PIG 이온원 제어시스템
|
2 |
2
제1항에 있어서, 상기 제어장치는상기 제1 패러데이 컵으로부터 측청된 이온빔 전류를 입력받고, 상기 제2 패러데이 컵으로부터 측정된 암전류를 입력받고, 상기 파워 서플라이로부터 출력된 전류를 입력받고, 상기 가스 출력량 컨트롤러로부터 가스 출력량을 입력받는 입력부;상기 입력부로부터, 상기 이온빔 전류, 암전류, 파워 서플라이 전류, 가스 출력량을 전달받고, 상기 Q-학습의 상태, 액션 및 보상에 대해 선택된 암전류, 이온빔 전류를 상태로, 상기 파워 서플라이 출력 전류의 증분과 가스 출력량 증분을 액션(action)으로, 하기식을 보상으로 설정하는 설정부;보상={a(|Ibeamoutput-Isetting|t-|Ibeamoutput-Isetting|t+1)-bH(|Idark|)} (여기서, a와 b는 가중치로 양수값이며, δ는 미리 설정한 암전류 임계치이며, Ibeamoutput은 상기 제1 패러데이 컵에서 측정된 이온빔 출력값이며, Isetting 은 이온빔 설정값이며, H(|Idark|)는 상기 제2 패러데이 컵에서 측정된 암전류값이 상기 δ보다 작은 경우에, 0이며, 상기 δ보다 큰 경우에 1임)상기 Q-학습의 상태에서 임의의 상태값 및 상기 선택된 상태값에서 적어도 하나 이상의 액션값을 선택하는 선택부;상기 선택된 상태값 및 액션값을 기초로 이에 대응하는 하나 이상의 보상값을 연산하는 연산부; 및상기 보상값 중에서 최고의 보상값을 가지는 파워 서플라이 전류의 증분과 가스 출력량 증분을 최적의 파워 서플라이 전류의 증분과 가스 출력량 증분으로 판단하는 판단부;상기 판단부에서 판단된 파워 서플라이 전류의 증분과 가스 출력량 증분에 기초하여 상기 파워 서플라이 전류를 제어하는 제1 제어신호를 생성하고, 상기 가스 출력량을 제어하는 제2 제어신호를 생성하고, 상기 제1 제어신호를 상기 파워 서플라이로 전달하고, 상기 제2 제어신호를 상기 가스 출력량 컨트롤러로 전달하는 제어신호 생성부를 포함하는 것을 특징으로 하는 Q-학습(Q-learning)을 이용한 사이클로트론용 PIG 이온원 제어시스템
|