1 |
1
5G 이기종 트래픽이 있는 신호 대기열 모델에서 스케줄러에 다수 사용자들의 패킷 수 N, K 개의 상태들과 각 상태들에 대응하는 동작 보상 매트릭스를 입력하는 단계;스케줄러에서 전송 시간 간격(TTI, Transmission Time Interval)에 대응되는 이산 정수인 각 시간 단계 t 값을 K와 비교하는 단계;상기 t 값이 K 보다 크면(t〉K), 스케줄러에서 최대 UCB1(Upper Confidence Bound) 신뢰 지수를 가진 상태를 선택하는 단계;패킷 전송의 성공 여부에 따른 보상 및 신뢰 지수를 기초로, 시간 단계 t에서의 각 상태에 대한 보상값을 계산하는 단계; 및시간 단계 t에서 선택된 동작값을 리턴하는 단계;를 포함하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
2 |
2
제1항에 있어서,상기 t 값이 K 보다 작거나 같으면(t≤K), 테스트되지 않은 다음 상태를 선택하여 UCB1 지수를 결정하는 단계;를 더 포함하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
3 |
3
제1항에 있어서,시간 단계 t에서 선택된 동작값을 리턴 후, 다음 시간 단계 t+1에 대한 동작 보상 매트릭스를 업데이트하는 단계;를 더 포함하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
4 |
4
제1항에 있어서,상기 패킷 전송의 성공 여부에 따른 보상은, 전송 성공하는 경우 x이고, 전송 실패는 경우 y인, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
5 |
5
제1항에 있어서,K는 SCS(scalable subcarrier spacing)와 OFDM(Orthogonal Frequency Division Multiplex) 심볼 수의 조합인, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
6 |
6
제1항에 있어서, 상기 스케줄러에서 각 시간 단계 t 값을 K와 비교하는 단계는,스케줄러가 모든 상태 k가 시도되고, 각 상태에서의 신뢰 지수가 결정되는지 여부를 검사하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
7 |
7
제6항에 있어서, 상기 스케줄러에서 각 시간 단계 t 값을 K와 비교하는 단계는,모든 상태가 한 번씩 시도되고 신뢰 지수가 기록될 때까지 다음 상태가 선택되는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법
|
8 |
8
제1항 내지 제7항 중 어느 하나의 항에 따른 상기 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 저장 매체
|
9 |
9
5G 이기종 트래픽이 있는 신호 대기열 모델에서 스케줄러에 다수 사용자들의 패킷 수 N, K 개의 상태들과 각 상태들에 대응하는 동작 보상 매트릭스를 입력하는 학습 데이터 입력부;스케줄러에서 전송 시간 간격(TTI, Transmission Time Interval)에 대응되는 이산 정수인 각 시간 단계 t 값을 K와 비교하는 스케쥴러 조절부;상기 t 값이 K 보다 크면(t〉K), 스케줄러에서 최대 UCB1(Upper Confidence Bound) 신뢰 지수를 가진 상태를 선택하고, 상기 t 값이 K 보다 작거나 같으면(t≤K), 테스트되지 않은 다음 상태를 선택하여 UCB1 지수를 결정하는 신뢰 지수 선택부;패킷 전송의 성공 여부에 따른 보상 및 신뢰 지수를 기초로, 시간 단계 t에서의 각 상태에 대한 보상값을 계산하는 보상값 계산부; 및시간 단계 t에서 선택된 동작값을 리턴하는 동작값 리턴부;를 포함하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 장치
|
10 |
10
제9항에 있어서, 상기 보상값 계산부는,시간 단계 t에서 선택된 동작값을 리턴 후, 다음 시간 단계 t+1에 대한 동작 보상 매트릭스를 업데이트하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 장치
|
11 |
11
제9항에 있어서,K는 SCS(scalable subcarrier spacing)와 OFDM(Orthogonal Frequency Division Multiplex) 심볼 수의 조합인, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 장치
|
12 |
12
제9항에 있어서, 상기 스케쥴러 조절부는,모든 상태 k가 시도되고, 각 상태에서의 신뢰 지수가 결정되는지 여부를 검사하고, 모든 상태가 한 번씩 시도되고 신뢰 지수가 기록될 때까지 다음 상태를 선택하는, 5G 무선 액세스 네트워크를 위한 강화 학습 기반 적응적 속도 제어 장치
|