1 |
1
NOMA(non-orthogonal multiple access) 시스템에서 기지국의 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법에 있어서,상기 기지국의 커버리지에 위치한 사용자 장치들의 채널 이득들을 크기 순서로 정렬하는 정렬 단계; 상기 크기 순서에 기반하여 각각의 클러스터로 사용자 장치를 할당하는 클러스터링 단계; 및 상태 및 행동에 기반한 품질 함수를 사용하여 상기 클러스터에 포함된 각 사용자 장치에 대한 전력을 할당하는 전력 할당 단계를 포함하고, 상기 상태는 현재 타임 슬롯에서 최소의 데이터 레이트를 갖는 사용자 장치의 인덱스이고 상기 행동은 상기 클러스터 내 상기 사용자 장치의 전력 레벨에 해당하며, 상기 품질 함수는 각각의 상태 및 행동 조합에 대하여 할인 기대 보상 값을 제공하는 함수인사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
2 |
2
제1항에 있어서, 상기 클러스터링 단계는,상기 채널 이득들의 크기 순서로 정렬된 사용자 장치들 중에서 n+(z-1)*k 번째에 위치한 사용자 장치를 n 번째 클러스터에 할당하는 단계를 포함하고,여기서 n은 클러스터의 인덱스, z는 n 번째 클러스터 내 해당 사용자 장치의 순서, k는 클러스터의 개수인 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
3 |
3
제2항에 있어서, 상기 클러스터링 단계는,상기 커버리지 내 모든 사용자 장치들의 개수에 대한 상기 클러스터의 개수의 모듈러(modular) 연산에 기반하여 상기 각각의 클러스터에 포함된 사용자 장치의 개수를 결정하는 단계를 포함하는 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
4 |
4
제1항에 있어서, 상기 전력 할당 단계는, 상기 사용자 장치에 전력을 할당하기 이전에 상기 커버리지 내 각각의 사용자 장치에 대하여 임의의 행동을 할당하는 초기화 단계를 더 포함하는 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
5 |
5
제1항에 있어서, 상기 전력 할당 단계는,상기 품질 함수에서 최대의 할인 기대 보상 값을 제공하는 행동 및 상태 조합에 대응하는 최적의 행동을 획득하는 단계를 포함하는 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
6 |
6
제5항에 있어서, 상기 전력 할당 단계는,상기 획득된 최적의 행동에 클러스터 당 전력 예산을 곱한 값을 할당하는 단계를 포함하는사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
7 |
7
제1항에 있어서, 상기 전력 할당 단계는,상기 클러스터 내 각 사용자 장치의 데이터 레이트를 획득하는 데이터 레이트 획득 단계를 더 포함하는사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
8 |
8
제7항에 있어서, 상기 전력 할당 단계는,상기 클러스터 내 각 사용자 장치의 데이터 레이트에 기반하여 상기 품질 함수를 업데이트하는 품질 함수 업데이트 단계를 더 포함하는사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
9 |
9
제8항에 있어서, 상기 품질 함수 업데이트 단계는, 상기 클러스터에서 최소의 데이터 레이트가 최소 데이터 레이트 요구량 보다 크면 상기 커버리지에 위치하는 사용자 장치들의 데이터 레이트의 총합을 보상 값으로 설정하는 단계;상기 클러스터에서 최소의 데이터 레이트가 최소 데이터 레이트 요구량 보다 작거나 같으면 0을 상기 보상 값으로 설정하는 단계; 및 상기 설정된 보상 값을 사용하여 상기 품질 함수를 업데이트하는 단계를 포함하는 사용자 클러스터링 및 강화학습 기반 전송전력 할당 방법
|
10 |
10
제1항 내지 제9항에 따른 동작을 수행하도록 설정된 기지국; 및 상기 기지국에 의해 서비스되는 사용자 장치들을 포함하는 NOMA 시스템
|