맞춤기술찾기

이전대상기술

연합강화학습을 통한 다중 디바이스 제어 시스템 및 그 방법

  • 기술번호 : KST2020015035
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 연합강화학습을 통한 다중 디바이스 제어 시스템 및 그 방법에 관한 것으로, 복수의 디바이스 제어 장치에서 복수의 디바이스를 각각 제어하기 위한 강화학습을 수행할 때, 상기 각 강화학습에 대한 그레디언트를 평균하여 상기 복수의 디바이스 제어 장치로 공유하는 그레디언트 공유(gradient sharing)과정과, 상기 그레디언트 공유과정을 통해 강화학습이 먼저 종료된 특정 디바이스 제어 장치의 학습파라미터를 상기 강화학습이 종료되지 않은 적어도 하나 이상의 디바이스 제어 장치로 전이하는 학습파라미터 전이(transfer)과정을 통해, 상기 복수의 디바이스 제어 장치에서 상기 강화학습을 연합한 연합강화학습을 수행하도록 함으로써, 상기 강화학습을 조기에 종료함과 동시에, 상기 강화학습 결과를 이용하여 상기 복수의 디바이스를 정밀하게 제어할 수 있도록 하는 연합강화학습을 통한 다중 디바이스 제어 시스템 및 그 방법에 관한 것이다.
Int. CL G06N 20/00 (2019.01.01)
CPC G06N 20/00(2013.01)
출원번호/일자 1020190157925 (2019.12.02)
출원인 한국기술교육대학교 산학협력단
등록번호/일자 10-2173579-0000 (2020.10.28)
공개번호/일자
공고번호/일자 (20201103) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.12.02)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국기술교육대학교 산학협력단 대한민국 충청남도 천안시 동남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 한연희 대전광역시 유성구
2 임현교 충청남도 천안시 동남구
3 김찬명 충청남도 천안시 동남구
4 김주봉 충청북도 청주시 흥덕구
5 황규영 충청남도 천안시 동남구
6 최호빈 충청남도 천안시 동남구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김견수 대한민국 서울특별시 강남구 테헤란로*길 ** (역삼동, 한덕빌딩) ***호(다함특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국기술교육대학교 산학협력단 충청남도 천안시 동남구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.12.02 수리 (Accepted) 1-1-2019-1239558-85
2 [우선심사신청]심사청구서·우선심사신청서
2020.05.11 수리 (Accepted) 1-1-2020-0471736-82
3 선행기술조사의뢰서
Request for Prior Art Search
2020.05.11 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2020.07.01 발송처리완료 (Completion of Transmission) 9-6-2020-0085645-41
5 의견제출통지서
Notification of reason for refusal
2020.07.28 발송처리완료 (Completion of Transmission) 9-5-2020-0513909-05
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.08.05 수리 (Accepted) 1-1-2020-0821519-46
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.08.05 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0821541-41
8 등록결정서
Decision to grant
2020.10.15 발송처리완료 (Completion of Transmission) 9-5-2020-0708124-99
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
복수의 디바이스를 각각 제어하기 위한 강화학습을 수행하고, 상기 강화학습의 과정에서 계산되는 그레디언트와, 상기 강화학습의 완료에 따른 학습파라미터를 연합강화학습 매니징 서버로 리포팅하는 복수의 디바이스 제어 장치; 및상기 복수의 디바이스 제어 장치로부터 리포팅된 복수의 그레디언트에 대한 평균을 계산한 평균 그레디언트를 상기 복수의 디바이스 제어 장치로 공유(sharing)하고, 상기 리포팅된 강화학습 파라미터를 상기 강화학습이 완료되지 않은 적어도 하나 이상의 디바이스 제어 장치로 전이(transfer)하는 연합강화학습 매니징 서버;를 포함하며,상기 평균한 그레디언트를 공유하는 것과, 상기 학습파라미터를 전이하는 것을 통해 상기 복수의 디바이스 제어 장치에서, 상기 강화학습을 연합한 연합강화학습을 수행하도록 함으로써, 상기 복수의 디바이스에서 수행하는 각각의 강화학습을 완료하도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
2 2
청구항 1에 있어서,상기 복수의 디바이스 제어 장치는,상기 연합강화학습을 통해 상기 디바이스를 제어하기 위한 학습모델을 생성하는 연합강화 학습부;를 포함하며,상기 연합강화 학습부는,상기 연합강화학습 매니징 서버의 요청에 따라, 현재 수행중인 강화학습에 대한 그레디언트를 계산하여 상기 연합강화학습 매니징 서버로 리포팅하는 그레디언트 리포팅부;상기 연합강화학습 매니징 서버로부터 상기 리포팅된 복수의 그레디언트에 대한 평균을 계산한 평균 그레디언트를 수신하는 평균 그레디언트 수신부;상기 연합강화학습 매니징 서버에 상기 학습파라미터를 리포팅하는 학습파라미터 리포팅부; 및상기 연합강화학습 매니징 서버로부터 최초 리포팅된 상기 학습파라미터를 수신하는 학습파라미터 수신부;를 더 포함하며,상기 연합강화 학습부는, 상기 수신한 평균 그레디언트를 이용하여 상기 강화학습을 지속하여 수행하고, 해당 강화학습이 완료되지 않은 상태에서 상기 학습파라미터가 수신되는 경우, 상기 수신한 학습파라미터를 사용하여 상기 강화학습을 수행함으로써, 상기 완료되지 않은 상태의 강화학습을 완료하기 위한 연합강화학습을 수행하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
3 3
청구항 1에 있어서,상기 그레디언트는,상기 강화학습을 수행하는 과정에서, 상기 강화학습이 수행되는 속도이며, 상기 평균 그레디언트를 공유하는 것을 통해서, 상기 공유한 평균 그레디언트에 따라 상기 복수의 디바이스 제어 장치를 통해 수행되는 각각의 강화학습이 진행되도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
4 4
청구항 2에 있어서,상기 복수의 디바이스 제어 장치는,상기 생성한 학습모델을 이용하여 상기 디바이스를 제어하는 디바이스 제어부; 및상기 디바이스를 제어한 결과인 디바이스의 상태정보를 상기 연합강화학습 매니징 서버로 제공하는 디바이스 상태정보 제공부;를 더 포함하며,상기 복수의 디바이스 제어 장치는, 상기 연합강화학습 매니징 서버로부터, 상기 상태정보를 모니터링한 결과에 따라 상기 연합강화학습에 대한 재수행 명령이 수신되는 경우, 상기 연합강화학습을 재수행하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
5 5
청구항 1에 있어서,상기 연합강화학습 매니징 서버는,상기 복수의 디바이스 제어 장치에 상기 그레디언트를 요청하여 수신하는 그레디언트 수신부;상기 복수의 디바이스 제어 장치로부터 수신한 복수의 그레디언트를 평균한 평균 그레디언트를 복수의 디바이스 제어 장치로 전송하여 공유하는 그레디언트 공유부;상기 공유한 평균 그레디언트를 이용하여 지속한 상기 강화학습이 완료된 디바이스 제어 장치로부터, 리포팅되는 학습파라미터를 수신하는 학습파라미터 수신부; 및상기 수신한 학습파라미터를 상기 강화학습이 완료되지 않은, 상기 적어도 하나 이상의 디바이스 제어 장치로 제공하는 학습파라미터 제공부;를 포함하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
6 6
청구항 5에 있어서,상기 연합강화학습 매니징 서버는,상기 복수의 디바이스 제어 장치로부터 상기 디바이스를 제어한 결과인 디바이스의 상태정보를 수신하는 디바이스 상태정보 수신부;를 더 포함하며,상기 수신한 상태정보를 모니터링하고, 모니터링한 결과가 사전에 설정한 임계범위를 벗어나는 경우, 상기 연합강화학습에 대한 재수행 명령을 상기 복수의 디바이스 제어 장치로 전송하여 상기 연합강화학습을 재수행하도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 시스템
7 7
복수의 디바이스 제어 장치에서, 디바이스를 제어하기 위한 강화학습을 개별적으로 수행하고, 연합강화학습 매니징 서버의 요청에 따라 상기 강화학습을 수행하는 과정에서의 그레디언트를 계산하여 상기 연합강화학습 매니징 서버로 리포팅하는 단계;상기 연합강화학습 매니징 서버에서, 상기 복수의 디바이스 제어 장치로부터 리포팅된 복수의 그레디언트에 대한 평균을 계산한 평균 그레디언트를 상기 복수의 디바이스 제어 장치로 제공하여 공유하는 단계;상기 복수의 디바이스 제어 장치에서, 상기 공유한 평균 그레디언트를 이용하여 상기 강화학습을 지속하는 단계;상기 복수의 디바이스 제어 장치 중 적어도 하나에서, 평균 그레디언트를 이용하여 지속한 상기 강화학습이 완료되면, 상기 완료된 결과에 따른 학습파라미터를 상기 연합강화학습 매니징 서버로 리포팅하는 단계;상기 연합강화학습 매니징 서버에서, 상기 학습파라미터를 학습이 완료되지 않은 적어도 하나 이상의 디바이스 제어 장치로 전송하여 전이하는 단계; 및상기 적어도 하나 이상의 디바이스 제어 장치에서, 상기 연합강화학습 매니징 서버에서 전송하여 전이한 상기 학습파라미터를 사용하여 상기 강화학습을 계속하여 수행하는 단계;를 포함하며,상기 평균 그레디언트를 공유하는 것과, 상기 학습파라미터를 전이하는 것을 통해 상기 복수의 디바이스 제어 장치에서, 상기 강화학습을 연합한 연합강화학습을 수행하도록 함으로써, 상기 복수의 디바이스 제어 장치에서 수행하는 각각의 강화학습을 완료하도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 방법
8 8
청구항 7에 있어서,상기 그레디언트는, 상기 강화학습을 수행하는 과정에서, 상기 강화학습이 수행되는 속도이며, 상기 평균 그레디언트를 공유하는 것을 통해서, 상기 공유한 평균 그레디언트에 따라 상기 복수의 디바이스 제어 장치를 통해 수행되는 각각의 강화학습이 진행되도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 방법
9 9
청구항 7에 있어서,상기 연합강화학습을 통한 다중 디바이스 제어 방법은,상기 복수의 디바이스 제어 장치에서, 상기 연합강화학습을 통해 생성된 학습모델을 통해 상기 디바이스를 제어하는 단계; 및상기 복수의 디바이스 제어 장치에서, 상기 디바이스를 제어한 결과인 디바이스의 상태정보를 상기 연합강화학습 매니징 서버로 제공하는 단계;를 더 포함하며, 상기 복수의 디바이스 제어 장치에서, 상기 연합강화학습 매니징 서버로부터, 상기 상태정보를 모니터링한 결과에 따라 상기 연합강화학습에 대한 재수행 명령이 수신되는 경우, 상기 연합강화학습을 재수행하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 방법
10 10
청구항 7에 있어서,상기 연합강화학습을 통한 다중 디바이스 제어 방법은,상기 연합강화학습 매니징 서버에서, 상기 복수의 디바이스 제어 장치로부터 상기 디바이스를 제어한 결과인 디바이스의 상태정보를 수신하는 단계;를 더 포함하며,상기 연합강화학습 매니징 서버에서, 상기 수신한 디바이스의 상태정보를 모니터링하고, 모니터링한 결과가 사전에 설정한 임계범위를 벗어나는 경우, 상기 연합강화학습에 대한 재수행 명령을 상기 복수의 디바이스 제어 장치로 전송하여 상기 연합강화학습을 재수행하도록 하는 것을 특징으로 하는 연합강화학습을 통한 다중 디바이스 제어 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 한국기술교육대학교 산학협력단 대학중점연구소지원사업 상호작용 가상현실 기반 몰입형 교육 훈련 플랫폼