1 |
1
대용량의 데이터 분류에 사용될 이용가능한 그리드 자원을 분류하는 자원 관리 모듈과, 상기 데이터 분류를 위한 임계값을 초기화하여 데이터를 분류하되, 분류가 완료된 데이터의 결과에 따라 임계값을 조정하는 임계값 조정 모듈과, 상기 임계값 조정 모듈로 분류가 완료된 데이터의 결과를 검사하여 결과를 전달하는 결과 테스트 모듈을 포함하는 데이터 분류 관리부;상기 그리드 자원 및 임계값을 전달하고, 분류가 완료된 데이터를 병합하여 상기 결과 테스트 모듈로 전송하는 다수의 자원 중개 모듈을 포함하는 데이터 중개부; 및상기 그리드 자원 및 임계값을 수신하여 대용량 데이터를 클러스터로 분류하여 훈련시키되, 이상치 클러스터는 제거하여 상기 데이터 중개부로 전송하는 다수의 데이터 분류부;를 포함하는 그리드 기반 대용량 데이터 분류 장치
|
2 |
2
제1항에 있어서,상기 자원 관리 모듈은 이용 가능한 그리드 자원을 수집하여 저장 공간 및 작업 처리량에 따라 분류하는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 장치
|
3 |
3
제1항에 있어서,상기 이상치 클러스터는 생성된 클러스터 중에서 데이터를 대표할 수 없거나 또는 포함된 데이터의 비중이 크지 않은 클러스터인 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 장치
|
4 |
4
제1항에 있어서,상기 자원 중개 모듈은상기 그리드 자원 및 임계값을 데이터 분류부에 전달하는 정보 전달기; 및다수개의 데이터 분류부로부터 출력된 데이터 훈련, 분류 결과 및 클러스터 정보를 병합하여 상기 결과 테스트 모듈로 전송하는 결과 통합기;를 포함하는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 장치
|
5 |
5
제1항에 있어서,상기 데이터 분류부는상기 데이터를 입력 및 관리하는 훈련 데이터 관리 모듈;상기 그리드 자원을 사용하고, 임계값을 기반으로 데이터가 분류되도록 클러스터를 생성시켜 훈련하는 데이터 훈련 모듈;상기 클러스터를 형성하는 대표 데이터를 관리 및 갱신하는 클러스터 관리 모듈; 및생성된 클러스터 중 이상치 클러스터를 제거하는 클러스터 제거 모듈;을 포함하는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 장치
|
6 |
6
제5항에 있어서,상기 클러스터 제거 모듈은 생성된 전체 클러스터를 검사하되, 각 클러스터에 소속된 데이터의 수가 일정 기준 이하 또는 해당 클러스터가 데이터를 대표할 수 없는 이상치 클러스터를 제거하는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 장치
|
7 |
7
대용량 데이터 분류를 위해 수집된 그리드 자원을 저장 공간 및 작업 처리량에 따라 분류하고, 임계값을 초기화하는 단계;상기 분류된 그리드 자원으로 동적으로 작업을 할당받아 임계값 기반으로 데이터가 분류되도록 클러스터를 생성하여 훈련하고, 전체 클러스터를 검사하고, 이상치 클러스터를 제거하여 전송하는 단계;상기 데이터 훈련, 분류 및 클러스터 정보를 병합한 결과를 검사하되, 최적의 임계값이 유도되도록 임계값을 조정하는 단계;를 포함하는 그리드 기반 대용량 데이터 분류 방법
|
8 |
8
제7항에 있어서,상기 이상치 클러스터는 해당 클러스터가 데이터를 대표할 수 없거나 또는 생성된 전체 클러스터 중에서 각 클러스터에 소속된 데이터 수가 일정 기준 이하인 비중이 크지 않은 클러스터인 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 방법
|
9 |
9
제7항에 있어서,상기 데이터 분류 방법은대용량 데이터를 입력 및 관리하는 단계;동적으로 할당된 그리드 자원으로 전송된 임계값을 기반으로 데이터가 분류되도록 클러스터를 생성하여 훈련하는 단계;클러스터를 생성하는 대표 데이터를 관리 및 갱신하는 단계;생성된 전체 클러스터를 검사하여 이상치 클러스터를 제거하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 방법
|
10 |
10
제7항에 있어서,데이터 훈련 방법은대용량 데이터로부터 임계값을 기반으로 클러스터를 생성하는 단계;생성된 클러스터의 패턴을 임계값과 비교하여 입력된 데이터의 패턴과 매칭시키는 단계;생성된 클러스터의 패턴이 입력된 데이터의 패턴에 포함되면, 상기 데이터를 상기 생성된 클러스터에 소속시키는 단계;생성된 클러스터의 패턴이 입력된 데이터의 패턴에 포함되지 않으면, 새로운 패턴에 따른 클러스터를 생성하는 단계;클러스터를 생성시킨 데이터를 대표 데이터로 지정하여 갱신하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 방법
|
11 |
11
제7항에 있어서,이상치 클러스터 제거 방법은생성된 전체 클러스터를 검사하되, 각 클러스터에 소속된 데이터의 수가 일정 기준 이하 또는 해당 클러스터가 데이터를 대표할 수 없는 이상치 클러스터를 제거하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 그리드 기반 대용량 데이터 분류 방법
|