1 |
1
분산처리 시스템에 데이터를 저장하기 위한 데이터 전처리 장치에 있어서,복수 개의 데이터 소스를 통해 미가공 원데이터(Raw Data)를 수집하는 데이터 수집부; 복수 개의 전처리 모듈 중에서 사용자에 의해 선택된 전처리 모듈을 결정하는 전처리모듈 선택부; 및상기 복수 개의 전처리 모듈을 포함하고, 상기 선택된 전처리 모듈에 의해 상기 미가공 원데이터로부터 가공된 데이터를 생성하여 상기 분산처리 시스템으로 전달하는 응용 적응 전처리부(Application Adaption Pre-Processing)를 포함하고,상기 선택된 전처리 모듈은, 키워드 조합, 출력 양식, 또는 입력 양식 타입 중의 하나 이상에 기초하여 상기 미가공 원데이터에 대한 전처리를 수행하여 상기 가공된 데이터를 생성하는것을 특징으로 하는 데이터 전처리 장치
|
2 |
2
제 1 항에 있어서,상기 복수 개의 전처리 모듈은 서로 다른 응용(application)에 대응하는, 데이터 전처리 장치
|
3 |
3
제 2 항에 있어서,상기 전처리 모듈 선택부는 상기 복수 개의 전처리 모듈 중에서 상기 사용자의 선택값에 기초하여 상기 선택된 전처리 모듈을 결정하는, 데이터 전처리 장치
|
4 |
4
삭제
|
5 |
5
제 1 항에 있어서,상기 데이터 수집부는, 콜렉터 소스, 콜렉터 채널 및 콜렉터 싱크를 포함하고, 상기 콜렉터 소스는, 상기 복수 개의 데이터 소스의 각각에 대응하는 에이전트로부터 데이터를 수집하고,수집된 데이터는 상기 콜렉터 싱크로 전달되기 전에 상기 콜렉터 채널에 로깅되고,상기 콜렉터 싱크는 상기 콜렉터 채널로부터 전달된 데이터를 상기 응용 적응 전처리부로 전송하는, 데이터 전처리 장치
|
6 |
6
분산처리 시스템에 데이터를 저장하기 위한 데이터 전처리 방법에 있어서, 복수 개의 데이터 소스를 통해 미가공 원데이터를 수집하는 단계;복수 개의 전처리 모듈 중에서 사용자에 의해 선택된 전처리 모듈을 결정하는 단계; 및상기 선택된 전처리 모듈에 의해 상기 미가공 원데이터에 대한 전처리를 수행하는 단계를 포함하고, 상기 전처리를 수행하는 단계는, 키 워드의 조합, 전 처리 결과의 출력 양식, 및 저장 파일의 내부 형식 타입을 정의하는 입력 양식 타입 중의 하나 이상에 기초하여 상기 미가공 원데이터로부터 가공된 데이터를 생성하고, 상기 가공된 데이터를 상기 분산처리 시스템으로 전달하는 것을 포함하는, 데이터 전처리 방법
|
7 |
7
제 6 항에 있어서,상기 복수 개의 전처리 모듈은 서로 다른 응용(application)에 대응하는, 데이터 전처리 방법
|
8 |
8
제 7 항에 있어서,상기 결정하는 단계는, 상기 복수 개의 전처리 모듈 중에서 상기 사용자의 선택값에 기초하여 상기 선택된 전처리 모듈을 결정하는, 데이터 전처리 방법
|
9 |
9
삭제
|
10 |
10
제 6 항에 있어서,상기 미가공 원데이터를 수집하는 단계는, 콜렉터 소스를 이용하여, 상기 복수 개의 데이터 소스의 각각에 대응하는 에이전트로부터 데이터를 수집하고,수집된 상기 데이터를 콜렉터 싱크로 전달하기 전에 콜렉터 채널에 로깅하고, 상기 콜렉터 채널로부터 전달된 데이터를, 상기 콜렉터 싱크를 이용하여, 상기 복수 개의 전처리 모듈을 포함하는 응용 적응 전처리부로 전송하는 것을 포함하는, 데이터 전처리 방법
|