1 |
1
관계형 데이터의 질의 결과를 반환하는 복수의 제1 서버에 존재하는 각 제1 테이블 위치와, 비관계형 데이터의 질의 결과를 반환하는 복수의 제2 서버에 존재하는 각 제2 테이블 위치를 포함한 메타 데이터를 저장하는 메타 데이터 모듈;사용자가 웹 인터페이스부를 통해 상기 관계형 데이터와 상기 비관계형 데이터를 포함한 이종 데이터 분석 질의가 요청되면, 상기 메타 데이터 모듈과 연동하여 상기 요청된 이종 데이터 분석 질의에서 상기 복수의 제1 서버에 존재하는 각 제1 테이블 위치를 반환받고, 상기 복수의 제2 서버에 존재하는 각 제2 테이블 위치를 반환받고 상기 각 제1 테이블 위치를 이용하여 상기 복수의 제1 서버로 상기 관계형 데이터를 병렬적으로 요청하여 반환받는 질의 분석 모듈;상기 반환받은 관계형 데이터를 통합하여 최종 관계형 데이터를 생성하는 질의 통합기; 및상기 최종 관계형 데이터와 상기 비관계형 데이터를 참조하는 질의를 상기 각 제2 테이블 위치를 이용하여 상기 복수의 제2 서버로 요청하여 최종 질의 결과를 반환받은 후 상기 웹 인터페이스부로 전송하는 이종 데이터 이동 모듈을 포함하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
2 |
2
제1항에 있어서,상기 복수의 제1 서버는 표준 데이터베이스 질의 언어인 SQL(Structured Query Language)을 사용하는 개방 소스의 관계형 데이터베이스 관리 시스템이고, 상기 복수의 제2 서버는 하둡 상에서 SQL 문법으로 질의를 요청할 수 있으며 하둡 분산 파일 시스템(Hadoop Distributed File System, HDFS)을 데이터 저장고로 사용하는 Hive 노드인 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
3 |
3
제1항에 있어서,상기 질의 분석 모듈은 상기 요청된 이종 데이터 분석 질의가 상기 비관계형 데이터를 참조하지 않고 상기 관계형 데이터를 참조하는 경우 상기 복수의 제1 서버로 상기 관계형 데이터를 병렬적으로 요청하여 반환받으며 상기 비관계형 데이터를 참조하는 질의를 상기 복수의 제2 서버로 요청하지 않는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
4 |
4
제1항에 있어서,상기 질의 분석 모듈은 상기 요청된 이종 데이터 분석 질의가 상기 관계형 데이터를 참조하지 않고 상기 비관계형 데이터를 참조하는 경우 상기 복수의 제1 서버로 상기 관계형 데이터를 요청하지 않으며 상기 비관계형 데이터를 참조하는 질의를 상기 복수의 제2 서버로 요청하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
5 |
5
제1항에 있어서,상기 질의 분석 모듈은 상기 요청된 이종 데이터 분석 질의가 상기 비관계형 데이터를 참조하지 않고 상기 관계형 데이터를 참조하는 경우, 상기 이종 데이터 분석 질의를 하둡 분산 파일 시스템(Hadoop Distributed File System, HDFS)로 이동하지 않으며,상기 질의 통합기는 상기 관계형 데이터를 가장 많이 가지고 있는 클러스터를 찾아 해당 클러스터에서 상기 관계형 데이터의 통합을 수행하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
6 |
6
제1항에 있어서,상기 이종 데이터 처리를 위한 분산 병렬 처리 시스템은 상기 요청된 이종 데이터 분석 질의가 이종 데이터 처리가 필요한 경우, 상기 이종 데이터 이동 모듈이 각각의 클러스터의 SQL(Structured Query Language) 데이터를 로컬에 위치한 하둡 분산 파일 시스템(Hadoop Distributed File System, HDFS)에 전송하고, 상기 HDFS에 분산 저장을 수행하여 데이터 이동이 완료되는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
7 |
7
제1항에 있어서,상기 질의 분석 모듈과 상기 질의 통합기를 포함한 분산 병렬 질의 처리기는 클러스터가 가진 데이터의 행의 수와 질의하는 열을 기반으로 하기의 수학식 1에 의해 통신 비용을 예측하여 상기 통신 비용이 가장 적게 요구되는 클러스터를 선정하여 job을 생성하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
8 |
8
제1항에 있어서,상기 질의 분석 모듈과 상기 질의 통합기를 포함한 분산 병렬 질의 처리기는 단일 테이블에 대한 select 취합 job을 수행하면, 하기의 수학식 2에 의해 통신 비용을 예측하여 상기 통신 비용이 가장 적게 요구되는 클러스터를 선정하여 job을 생성하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|
9 |
9
제1항에 있어서,상기 질의 분석 모듈과 상기 질의 통합기를 포함한 분산 병렬 질의 처리기는 두 개의 테이블을 참조하는 세타 조인 질의 재구성 job을 수행하면, 하기의 수학식 3에 의해 통신 비용을 예측하여 상기 통신 비용이 가장 적게 요구되는 클러스터를 선정하여 job을 생성하는 것을 특징으로 하는 이종 데이터 처리를 위한 분산 병렬 처리 시스템
|