맞춤기술찾기

이전대상기술

강화 학습 및 가우시안 프로세스 회귀 기반 하이퍼 파라미터 최적화

  • 기술번호 : KST2022021265
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 강화 학습 및 가우시안 프로세스 회귀 기반 하이퍼 파라미터 최적화 기술이 개시된다. 일 실시예에 따른 하이퍼 파라미터 최적화 시스템에 의해 수행되는 하이퍼 파라미터 최적화 방법은, 강화 학습에 기초하여 에이전트로부터 선택된 하이퍼 파라미터의 조합을 통해 생성된 트레이닝 세트를 이용하여 머신러닝 모델을 업데이트하는 단계; 및 가우시안 프로세스 회귀를 사용하여 상기 업데이트된 머신러닝 모델에 대한 보상을 예측하는 단계를 포함할 수 있다.
Int. CL G06N 20/00 (2019.01.01)
CPC G06N 20/00(2013.01)
출원번호/일자 1020210058260 (2021.05.06)
출원인 한양대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0151257 (2022.11.15) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.05.06)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 조인휘 서울특별시 성동구
2 마지흔 서울특별시 광진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.05.06 수리 (Accepted) 1-1-2021-0522729-82
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
하이퍼 파라미터 최적화 시스템에 의해 수행되는 하이퍼 파라미터 최적화 방법에 있어서,강화 학습에 기초하여 에이전트로부터 선택된 하이퍼 파라미터의 조합을 통해 생성된 트레이닝 세트를 이용하여 머신러닝 모델을 업데이트하는 단계; 및 가우시안 프로세스 회귀를 사용하여 상기 업데이트된 머신러닝 모델에 대한 보상을 예측하는 단계를 포함하는 하이퍼 파마리터 최적화 방법
2 2
제1항에 있어서, 상기 업데이트하는 단계는, 머신러닝 모델의 제1 정책과 제2 정책을 포함하는 복수 개의 정책을 초기화하고, 상기 제1 정책을 이용하여 데이터를 샘플링하고, 상기 샘플링된 데이터로 상기 제2 정책을 트레이닝하고, 상기 머신러닝 모델에 상기 에이전트로부터 하이퍼 파라미터 최적화를 위한 복수 개의 하이퍼 파라미터가 선택됨을 수신하는 단계 를 포함하는 하이퍼 파마리터 최적화 방법
3 3
제2항에 있어서, 상기 업데이트하는 단계는, 상기 선택된 복수 개의 하이퍼 파라미터의 조합에 따라 생성된 트레이닝 세트를 이용하여 머신러닝 모델을 트레이닝하고, 벨리데이션 세트를 이용하여 상기 트레이닝된 머신러닝 모델의 정확도를 획득하고, 상기 획득된 정확도를 보상으로 사용하는 단계 를 포함하는 하이퍼 파마리터 최적화 방법
4 4
제3항에 있어서, 상기 업데이트하는 단계는, 상기 선택된 하이퍼 파라미터의 조합과 상기 획득된 보상을 사용하여 머신러닝 모델에 대한 PPO 알고리즘을 통해 제1 정책을 업데이트하고, 상기 선택된 하이퍼 파라미터의 조합과 상기 획득된 보상을 가우시안 예측을 위한 트레이닝 세트로 사용하는 단계를 포함하는 하이퍼 파마리터 최적화 방법
5 5
제1항에 있어서, 상기 예측하는 단계는, 상기 머신러닝에 구성된 복수 개의 정책의 KL 거리가 임계값보다 작거나 같으면 가우시안 프로세스 회귀를 사용하고, 상기 선택된 하이퍼 파라미터의 조합을 상기 가우시안 프로세스 회귀의 입력으로 사용하여 보상을 예측하고, 상기 선택된 하이퍼 파라미터의 조합과 상기 예측된 보상을 사용하여 PPO 알고리즘을 통해 제1 정책을 업데이트하는 단계 를 포함하는 하이퍼 파마리터 최적화 방법
6 6
제5항에 있어서, 상기 예측하는 단계는, 상기 가우시안 프로세스 회귀를 사용하여 보상을 예측하고, 상기 머신러닝에 구성된 복수 개의 정책의 KL 거리가 임계값보다 크다면, 트레이닝 세트에서 선택된 다른 하이퍼 파라미터의 조합을 이용하여 상기 머신러닝 모델을 트레이닝하는 과정을 반복하는 단계를 포함하는 하이퍼 파마리터 최적화 방법
7 7
하이퍼 파라미터 최적화 시스템에 있어서, 강화 학습에 기초하여 에이전트로부터 선택된 하이퍼 파라미터의 조합을 통해 생성된 트레이닝 세트를 이용하여 머신러닝 모델을 업데이트하는 강화 학습부; 및 가우시안 프로세스 회귀를 사용하여 상기 업데이트된 머신러닝 모델에 대한 보상을 예측하는 보상 예측부를 포함하는 하이퍼 파라미터 최적화 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 (주)시큐레이어 한국연구재단 부설 정보통신기획평가원 / 정보통신방송 연구개발사업 / SW컴퓨팅산업원천기술개발사업(통합이지바로) 데이터 특징과 문제를 정의하는 빅데이터 분석모델 추천 자동화 기술 개발