맞춤기술찾기

이전대상기술

무선 협력 통신 시스템을 기반으로 하는 Q-러닝 기반의 중계기 선정 장치 및 그 방법

  • 기술번호 : KST2020003440
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 무선 협력 통신 시스템을 기반으로 하는 Q-러닝 기반의 중계기 선정 장치 및 그 방법에 관한 것이다. 본 발명에 따르면, 소스 단말, 목적지 단말, K개의 중계기를 포함한 N개 단말로부터 임의 선택된 n(n=1,…,N)번째 송신측 단말을 상태(sn)로, 해당 상태(sn)에서 임의 선택된 m(m=1,…,N)번째 수신측 단말을 행동(am)으로, m번째 수신측 단말에서의 SNR 지표를 해당 상태(sn)에서 취한 행동(am)에 따른 즉각적인 보상(R; R(sn,am))으로 정의하는 단계, 상태 및 행동에 각각 대응하여 행과 열 성분을 구성한 N×N 크기의 Q 행렬 내 원소들인 Q값들을 초기화하는 단계, N개의 단말 중에서 임의 선택된 상태(sn)와 행동(am)에 대한 즉각적인 보상(R(sn,am))과, 현재 취한 행동(am)으로 인해 이동한 미래 상태(sn')의 선택 가능한 모든 행동(am')에 대응하는 Q값들 중 최대치(max(Q(sn',am'))를 이용하여 Q-러닝을 수행하여, Q 행렬 내의 Q(sn,am) 값을 업데이트하는 단계, 상태 및 행동의 임의 선택을 통해 Q-러닝을 반복 수행하면서 Q 행렬을 지속 업데이트하는 단계, 및 업데이트가 완료된 Q 행렬 내에서 탐색한 최대 Q값에 대응된 하나의 중계기를 최적 중계기로 선정하는 단계를 포함하는 중계기 선정 방법을 제공한다. 본 발명에 따르면, 다수의 중계기가 존재하는 환경에서 Q-러닝을 이용하여 최적 중계기를 선정함으로써 시스템의 신뢰성 및 비트 요율 성능을 높일 수 있다.
Int. CL H04B 7/155 (2006.01.01) H04B 17/336 (2014.01.01) G06N 20/00 (2019.01.01)
CPC H04B 7/15592(2013.01) H04B 7/15592(2013.01) H04B 7/15592(2013.01)
출원번호/일자 1020190107494 (2019.08.30)
출원인 세종대학교산학협력단
등록번호/일자 10-2063643-0000 (2020.01.02)
공개번호/일자
공고번호/일자 (20200108) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.08.30)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 세종대학교산학협력단 대한민국 서울특별시 광진구 능동로 *** (군

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 송형규 경기도 성남시 분당구
2 백민재 서울특별시 노원구
3 나유진 경기도 용인시 수지구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인태백 대한민국 서울 금천구 가산디지털*로 *** 이노플렉스 *차 ***호

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 세종대학교 산학협력단 서울특별시 광진구 능동로 *** (군
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.08.30 수리 (Accepted) 1-1-2019-0896380-19
2 [우선심사신청]심사청구(우선심사신청)서
[Request for Preferential Examination] Request for Examination (Request for Preferential Examination)
2019.09.06 수리 (Accepted) 1-1-2019-0921658-83
3 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2019.09.10 수리 (Accepted) 9-1-9999-9999999-89
4 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2019.09.18 수리 (Accepted) 9-1-2019-0043568-75
5 의견제출통지서
Notification of reason for refusal
2019.09.23 발송처리완료 (Completion of Transmission) 9-5-2019-0684176-86
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.11.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-1191893-51
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.11.20 수리 (Accepted) 1-1-2019-1191894-07
8 등록결정서
Decision to grant
2019.12.31 발송처리완료 (Completion of Transmission) 9-5-2019-0941120-47
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
무선 협력 통신 시스템을 기반으로 하는 Q-러닝 기반의 중계기 선정 방법에 있어서,소스 단말, 목적지 단말, K개의 중계기를 포함한 N개 단말(N=K+2)로부터 임의 선택된 n(n=1,…,N)번째 송신측 단말을 상태(sn)로, 해당 상태(sn)에서 임의 선택된 m(m=1,…,N)번째 수신측 단말을 행동(am)으로, m번째 수신측 단말에서의 SNR 지표를 해당 상태(sn)에서 취한 행동(am)에 따른 즉각적인 보상(R; R(sn,am))으로 정의하는 단계;상기 상태 및 행동에 각각 대응하여 행과 열 성분을 구성한 N×N 크기의 Q 행렬 내 원소들인 Q값들을 초기화하는 단계;상기 N개의 단말 중에서 임의 선택된 상태(sn)와 행동(am)에 대한 즉각적인 보상(R(sn,am))과, 현재 취한 행동(am)으로 인해 이동한 미래 상태(sn')의 선택 가능한 모든 행동(am')에 대응하는 Q값들 중 최대치(max(Q(sn',am'))를 이용하여 Q-러닝을 수행하여, 상기 Q 행렬 내의 Q(sn,am) 값을 업데이트하는 단계; 상기 상태 및 행동의 임의 선택을 통해 Q-러닝을 반복 수행하면서 Q 행렬을 지속 업데이트하는 단계; 및업데이트가 완료된 Q 행렬 내에서 탐색한 최대 Q값에 대응된 하나의 중계기를 최적 중계기로 선정하는 단계를 포함하며,상기 N개 단말 중 n,m=1인 단말은 상기 소스 단말, n,m=N인 단말은 상기 목적지 단말, 나머지 N-2개는 상기 K개의 중계기이며,상기 즉각적인 보상인 R은 상기 선택된 행동 및 상태에 따라 N×N 가지로 존재하고 R(sn,am)=R(n,m)로 설정되되, N×N 개의 즉각적인 보상 중에서, 송신측 단말과 수신측 단말이 동일한 경우(n=m=i)의 보상값 R(i,i)과, 상기 소스 단말과 상기 목적지 단말 간 직경로에 해당한 경우의 보상값 R(1,N), 그리고 상기 목적지 단말(n=N)이 송신측인 경우의 보상값 R(N,i)은 아래의 수학식과 같이 모두 '0'의 값으로 설정되는 중계기 선정 방법:여기서, i={1,…N}이다
2 2
청구항 1에 있어서,상기 즉각적인 보상 R은 SNR을 기반으로 아래 수학식에 의해 결정되는 중계기 선정 방법:여기서, SNRm는 m번째 수신측 단말에서의 SNR 값, d는 n번째 송신측 단말과 m번째 수신측 단말 사이의 거리, ρ는 자유 공간 경로 손실을 나타낸다
3 3
삭제
4 4
청구항 1에 있어서,상기 중계기가 송신측(n=2,…,N-1)이고 상기 목적지 단말이 수신측(m=N)인 경우의 보상값 R(i,N)(이때, i≠1,N)은,보상 R의 수학식에 설정 가중치가 추가로 가산된 값을 사용하는 중계기 선정 방법
5 5
청구항 1에 있어서,상기 Q 행렬 내의 Q(sn,am) 값은 아래 수학식에 의해 업데이트되는 중계기 선정 방법:여기서, New Q(sn,am)는 업데이트된 Q(sn,am) 값, (0003c#003c#1)는 학습률, (0003c#003c#1)는 할인 계수(discount factor)를 나타낸다
6 6
청구항 1에 있어서,상기 상태와 행동의 임의 선택 시에 Decaying ε-greedy 알고리즘을 적용하여 시간이 경과할수록 무작위 선택 행동의 확률을 감소시키는 중계기 선정 방법
7 7
협력 통신 시스템을 위한 Q-러닝 기반의 중계기 선정 장치에 있어서,소스 단말, 목적지 단말, K개의 중계기를 포함한 N개 단말(N=K+2)로부터 임의 선택된 n(n=1,…,N)번째 송신측 단말을 상태(sn)로, 해당 상태(sn)에서 임의 선택된 m(m=1,…,N)번째 수신측 단말을 행동(am)으로, m번째 수신측 단말에서의 SNR 지표를 해당 상태(sn)에서 취한 행동(am)에 따른 즉각적인 보상(R; R(sn,am))으로 정의하는 설정부;상기 상태 및 행동에 각각 대응하여 행과 열 성분을 구성한 N×N 크기의 Q 행렬 내 원소들인 Q값들을 초기화하는 초기화부;상기 N개의 단말 중에서 임의 선택된 상태(sn)와 행동(am)에 대한 즉각적인 보상(R(sn,am))과, 현재 취한 행동(am)으로 인해 이동한 미래 상태(sn')의 선택 가능한 모든 행동(am')에 대응하는 Q값들 중 최대치(max(Q(sn',am'))를 이용하여 Q-러닝을 수행하여, 상기 Q 행렬 내의 Q(sn,am) 값을 업데이트하되, 상기 상태 및 행동의 임의 선택을 통해 Q-러닝을 반복 수행하면서 Q 행렬을 지속 업데이트하는 학습부; 및상기 업데이트가 완료된 Q 행렬 내에서 탐색한 최대 Q값에 대응된 하나의 중계기를 최적 중계기로 선정하는 결정부를 포함하며,상기 N개 단말 중 n,m=1인 단말은 상기 소스 단말, n,m=N인 단말은 상기 목적지 단말, 나머지 N-2개는 상기 K개의 중계기이며,상기 즉각적인 보상인 R은 상기 선택된 행동 및 상태에 따라 N×N 가지로 존재하고 R(sn,am)=R(n,m)로 설정되되, N×N 개의 즉각적인 보상 중에서, 송신측 단말과 수신측 단말이 동일한 경우(n=m=i)의 보상값 R(i,i)과, 상기 소스 단말과 상기 목적지 단말 간 직경로에 해당한 경우의 보상값 R(1,N), 그리고 상기 목적지 단말(n=N)이 송신측인 경우의 보상값 R(N,i)은 아래의 수학식과 같이 모두 '0'의 값으로 설정되는 중계기 선정 장치:여기서, i={1,…N}이다
8 8
청구항 7에 있어서,상기 즉각적인 보상 R은 SNR을 기반으로 아래 수학식에 의해 결정되는 중계기 선정 장치:여기서, SNRm는 m번째 수신측 단말에서의 SNR 값, d는 n번째 송신측 단말과 m번째 수신측 단말 사이의 거리, ρ는 자유 공간 경로 손실을 나타낸다
9 9
삭제
10 10
청구항 7에 있어서,상기 중계기가 송신측(n=2,…,N-1)이고 상기 목적지 단말이 수신측(m=N)인 경우의 보상값 R(i,N)(이때, i≠1,N)은,보상 R의 수학식에 설정 가중치가 추가로 가산된 값을 사용하는 중계기 선정 장치
11 11
청구항 7에 있어서,상기 Q 행렬 내의 Q(sn,am) 값은 아래 수학식에 의해 업데이트되는 중계기 선정 장치:여기서, New Q(sn,am)는 업데이트된 Q(sn,am) 값, (0003c#003c#1)는 학습률, (0003c#003c#1)는 할인 계수(discount factor)를 나타낸다
12 12
청구항 7에 있어서,상기 학습부는,상기 상태와 행동의 임의 선택 시에 Decaying ε-greedy 알고리즘을 적용하여 시간이 경과할수록 무작위 선택 행동의 확률을 감소시키는 중계기 선정 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 세종대학교 산학협력단 대학ICT연구센터지원사업 지능형 비행로봇 융합기술 연구