맞춤기술찾기

이전대상기술

PPO 모델 기반 SPARK SQL 조인 최적화 장치 및 방법

  • 기술번호 : KST2022019623
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 PPO 모델 기반 SPARK SQL 조인 최적화 장치에 관한 것으로, PPO(Proximal Policy Optimization) 모델을 학습시키기 위한 데이터 셋과 쿼리 셋(Dataset/QuerySet)을 로드하는 하둡 분산 파일 시스템(HDFS); 상기 하둡 분산 파일 시스템에서 리드한 쿼리를 입력받아 내부의 PPO 모델에 의해 특정 조인 순서를 가진 쿼리 플랜을 생성하는 PPO 기반 최적화부; 및 상기 HDFS에서 데이터 셋을 테이블로 읽어 상기 쿼리 플랜을 Spark SQL에 의해 실행 시간을 도출하는 Spark SQL부;를 포함하되, 상기 PPO 기반 최적화부는, 상기 쿼리 플랜의 실행 시간을 보상(reward)으로 사용하여 상기 PPO 모델을 학습한다.
Int. CL G06F 16/2453 (2019.01.01) G06F 16/22 (2019.01.01) G06F 8/41 (2018.01.01) G06N 20/00 (2019.01.01)
CPC G06F 16/24544(2013.01) G06F 16/2282(2013.01) G06F 8/427(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020210044542 (2021.04.06)
출원인 한국전력공사, 충남대학교산학협력단
등록번호/일자
공개번호/일자 10-2022-0138905 (2022.10.14) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전력공사 대한민국 전라남도 나주시
2 충남대학교산학협력단 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이규철 대전광역시 유성구
2 김인아 대전광역시 유성구
3 이경민 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인아주 대한민국 서울특별시 강남구 강남대로 ***, **,**층(역삼동, 동희빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.04.06 수리 (Accepted) 1-1-2021-0401680-84
2 특허고객번호 정보변경(경정)신고서·정정신고서
2021.10.05 수리 (Accepted) 4-1-2021-5261638-12
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
PPO(Proximal Policy Optimization) 모델을 학습시키기 위한 데이터 셋과 쿼리 셋(Dataset/QuerySet)을 로드하는 하둡 분산 파일 시스템(HDFS);상기 하둡 분산 파일 시스템에서 리드한 쿼리를 입력받아 내부의 PPO 모델에 의해 특정 조인 순서를 가진 쿼리 플랜을 생성하는 PPO 기반 최적화부; 및상기 HDFS에서 데이터 셋을 테이블로 읽어 상기 쿼리 플랜을 Spark SQL에 의해 실행 시간을 도출하는 Spark SQL부;를 포함하되,상기 PPO 기반 최적화부는, 상기 쿼리 플랜의 실행 시간을 보상(reward)으로 사용하여 상기 PPO 모델을 학습하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
2 2
제 1항에 있어서, 상기 PPO 기반 최적화부는,모델 학습이 시작되면, 쿼리(Query)를 상기 하둡 분산 파일 시스템에서 읽어와 PPO 모델의 입력으로 사용하기 위해 쿼리를 파싱하고, 파싱된 정보를 기반으로 강화학습 환경(Environment)의 상태(State)와 행동(Action)을 초기화(Initialize)하는 초기화 작업을 수행하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
3 3
제 2항에 있어서, 상기 PPO 기반 최적화부는,쿼리의 정보를, 릴레이션 상태, 조인 술어 상태, 및 셀렉션 상태인 3가지 상태(State)로 표현하고, 쿼리의 정보에 따라, 조인이 가능한 임의의 두 릴레이션을 조인하는 형식을 가진 행동에 해당하는 행동(action)의 기본 형식을 설정하고, 상기 3가지 상태와 행동 형식을 PPO 모델의 입력으로 사용하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
4 4
제 1항에 있어서, 상기 PPO 모델은,입력된 상태를 기반으로 하여 가능한 행동들의 후보를 도출하고 행동을 선택하며, 환경에서는 선택된 행동을 기반으로 기존의 상태를 새로운 상태로 업데이트하고, 행동에 대한 보상을 에이전트에게 전달하되, 이 때 최종 조인 순서가 도출되지 않았으면 항상 0값으로 전달되며, 최종적으로 조인 순서가 도출되면 PPO 기반 최적화부와 Spark SQL에 의해 최종 조인 순서에 대한 보상이 결정되고,상기 에이전트는 새로운 상태를 기반으로 하여 행동을 선택하는 과정을 계속해서 반복하며, 더 이상 선택할 행동이 없이, 조인 대상 릴레이션의 수가 1이 되는 종료 상태가 될 때까지 이 과정을 반복하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
5 5
제 1항에 있어서, 상기 PPO 기반 최적화부는,상기 PPO 모델이 종료 상태가 된 경우 도출된 조인 순서를 기반으로 Spark SQL이 인식할 수 있는 형태의 쿼리 플랜을 생성하여 Spark SQL부에 전달하며,상기 Spark SQL부는 HDFS에 저장된 데이터 셋을 테이블로 읽어 이를 기반으로 상기 쿼리 플랜을 Spark SQL에서 실행하여 실제 실행 시간을 도출하여 이를 다시 상기 PPO 기반 최적화부에 전달하며,상기 PPO 기반 최적화부에 지정된 보상 함수에 의해 보상으로 변환되어, 상기 PPO 모델을 학습하는데 사용하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
6 6
제 1항에 있어서, 상기 PPO 기반 최적화부는,도출한 쿼리 플랜의 실행 시간을, 실행 시간(Timen)에 역수를 취하고, 실행 시간이 많이 소요되는 플랜에 대해 임계 시간(k)을 정하여, 임계 시간을 초과할 경우 보상을 -1로 부여하여 이를 기준으로 실행 시간을 보상(Reward)으로 변환하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 장치
7 7
하둡 분산 파일 시스템(HDFS)이 PPO(Proximal Policy Optimization) 모델을 학습시키기 위한 데이터 셋과 쿼리 셋(Dataset/QuerySet)을 로드하는 단계; PPO 기반 최적화부가 상기 하둡 분산 파일 시스템에서 리드한 쿼리를 입력받아 내부의 PPO 모델에 의해 특정 조인 순서를 가진 쿼리 플랜을 생성하는 단계;Spark SQL부가 HDFS에서 데이터 셋을 테이블로 읽어 상기 쿼리 플랜을 Spark SQL에 의해 실행하여 실행 시간을 도출하는 단계; 및상기 PPO 기반 최적화부가 실행 시간을 보상(reward)으로 사용하여 상기 PPO 모델을 학습하는 단계;를 포함하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
8 8
제 7항에 있어서, 상기 모델 학습이 시작되면, 상기 PPO 기반 최적화부는,쿼리(Query)를 상기 하둡 분산 파일 시스템에서 읽어와 PPO 모델의 입력으로 사용하기 위해 쿼리를 파싱하고, 파싱된 정보를 기반으로 강화학습 환경(Environment)의 상태(State)와 행동(Action)을 초기화(Initialize)하는 초기화 작업을 수행하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
9 9
제 8항에 있어서, 상기 PPO 기반 최적화부는,쿼리의 정보를, 릴레이션 상태, 조인 술어 상태, 및 셀렉션 상태인 3가지 상태(State)로 표현하고, 쿼리의 정보에 따라, 조인이 가능한 임의의 두 릴레이션을 조인하는 형식을 가진 행동에 해당하는 행동(action)의 기본 형식을 설정하고, 상기 3가지 상태와 행동 형식을 PPO 모델의 입력으로 사용하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
10 10
제 7항에 있어서, 상기 PPO 모델은,입력된 상태를 기반으로 하여 가능한 행동들의 후보를 도출하고 행동을 선택하며, 선택된 행동을 기반으로 기존의 상태를 새로운 상태로 업데이트하고, 행동에 대한 보상을 에이전트에게 전달하되, 이 때 최종 조인 순서가 도출되지 않았으면 항상 0값으로 전달되며, 최종적으로 조인 순서가 도출되면 PPO 기반 최적화부와 Spark SQL에 의해 최종 조인 순서에 대한 보상이 결정되고,상기 에이전트는 새로운 상태를 기반으로 하여 행동을 선택하는 과정을 계속해서 반복하며, 더 이상 선택할 행동이 없이, 조인 대상 릴레이션의 수가 1이 되는 종료 상태가 될 때까지 이 과정을 반복하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
11 11
제 7항에 있어서, 상기 PPO 모델이 종료 상태가 된 경우,상기 PPO 기반 최적화부는, 도출된 조인 순서를 기반으로 Spark SQL이 인식할 수 있는 형태의 쿼리 플랜을 생성하여 Spark SQL부에 전달하며,상기 Spark SQL부는 HDFS에 저장된 데이터 셋을 테이블로 읽어 이를 기반으로 상기 쿼리 플랜을 Spark SQL에서 실행하여 실제 실행 시간을 도출하여 이를 다시 상기 PPO 기반 최적화부에 전달하며,상기 PPO 기반 최적부에 지정된 보상 함수에 의해 보상으로 변환되어, 상기 PPO 모델을 학습하는데 사용하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
12 12
제 7항에 있어서, 상기 PPO 기반 최적화부는,도출한 쿼리 플랜의 실행 시간을, 실행 시간(Timen)에 역수를 취하고, 실행 시간이 많이 소요되는 플랜에 대해 임계 시간(k)을 정하여, 임계 시간을 초과할 경우 보상을 -1로 부여하여 이를 기준으로 실행 시간을 보상(Reward)으로 변환하는 것을 특징으로 하는 PPO 모델 기반 SPARK SQL 조인 최적화 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.