1 |
1
사용자 분석툴과 원격에 위치한 분산 시스템을 이용한 데이터 분석 방법에 있어서, 상기 사용자 분석툴로부터 텐서 데이터가 원격으로 전송되면 기 설정된 임계값을 기반으로 상기 텐서 데이터를 밀도(Dense)형과 희소(Sparse)형 중 하나의 데이터로 변환한 후 상기 분산 시스템에 분배하여 저장하는 단계;상기 저장된 데이터에 대한 메타 데이터를 기록하는 단계;상기 사용자 분석툴로부터 분석 명령이 전송되면 분석 알고리즘과 상기 분산 시스템을 이용하여 상기 저장된 데이터의 분석을 수행하는 단계; 및상기 데이터 분석이 수행되면 분석 결과를 상기 분산 시스템에 저장하거나 및/또는 상기 사용자 분석툴로 전송하는 단계를 포함하는 것을 특징으로 하는 데이터 분석 방법
|
2 |
2
제 1 항에 있어서, 상기 데이터 변환 단계는상기 텐서 데이터를 희소형으로 표현한 경우 요구되는 총 데이터 양을 산출하는 단계;상기 텐서 데이터를 밀도형으로 표현한 경우 요구되는 총 데이터 공간을 산출하는 단계;상기 총 데이터 양과 상기 총 데이터 공간과의 비율을 산출하는 단계; 및상기 비율이 상기 임계값보다 작으면 상기 텐서 데이터를 희소형의 데이터로 변환하고, 작지 않으면 밀도형의 데이터로 변환하는 단계를 포함하는 것을 특징으로 하는 데이터 분석 방법
|
3 |
3
제 1 항에 있어서, 상기 임계값은 사용자가 임의로 지정하거나 자동으로 지정되는 것을 특징으로 하는 데이터 분석 방법
|
4 |
4
제 1 항에 있어서, 상기 메타 데이터는 관리하는 텐서의 이름, 소유권자, 생성일시, 억세스권, 차원, 밀도, 희소도, 상기 분산 시스템에 저장된 데이터의 위치, 및 억세스 방법 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터 분석 방법
|
5 |
5
제 1 항에 있어서, 상기 사용자 분석툴로부터 요청에 따라 상기 분산 시스템에 저장된 데이터들을 리스트-업하거나 검색하는 단계를 더 포함하는 것을 특징으로 하는 데이터 분석 방법
|
6 |
6
제 1 항에 있어서, 상기 분석 단계는상기 분석 알고리즘의 일부 또는 전체를 아인슈타인 합 방식으로 변환하는 단계를 더 포함하는 것을 특징으로 하는 데이터 분석 방법
|
7 |
7
제 6 항에 있어서, 상기 분석 단계는상기 아인슈타인 합 방식으로 분석 알고리즘을 수행하는 경우, 밀도형 데이터와 희소형 데이터를 선택적으로 지정하여 처리하는 것을 특징으로 하는 데이터 분석 방법
|
8 |
8
사용자 분석툴을 구비한 사용자 분석부;데이터를 분산 저장하고 처리하는 분산 시스템; 및상기 사용자 분석부로부터 원격으로 전송되는 텐서 데이터를 기 설정된 임계값을 기반으로 밀도(Dense)형과 희소(Sparse)형 중 하나의 데이터로 변환한 후 상기 분산 시스템에 분배하여 저장하고, 상기 저장된 데이터에 대한 메타 데이터를 기록하며, 상기 사용자 분석부로부터 분석 명령이 전송되면 분석 알고리즘을 수행하여 상기 저장된 데이터를 분석하는 대용량 텐서 분석 엔진을 포함하여 구성되는 것을 특징으로 하는 데이터 분석 장치
|
9 |
9
제 8항에 있어서, 상기 대용량 텐서 분석 엔진은상기 데이터의 분석 결과를 상기 분산 시스템에 저장하거나 및/또는 상기 사용자 분석부로 전송하는 것을 특징으로 하는 데이터 분석 장치
|
10 |
10
제 8 항에 있어서, 상기 대용량 텐서 분석 엔진은상기 메타 데이터를 기록하고, 상기 사용자 분석부로부터 요청에 따라 상기 분산 시스템에 저장된 데이터들을 리스트-업하거나 검색을 수행하는 데이터 매니저;상기 사용자 분석부로부터 원격으로 전송되는 텐서 데이터를 기 설정된 임계값을 기반으로 밀도형과 희소형 중 하나의 데이터로 변환한 후 상기 분산 시스템에 분배하여 저장하는 데이터 변환부;상기 분석 알고리즘의 수행을 위해 라이브러리를 제공하는 분석 라이브러리; 및상기 분석 알고리즘의 일부 또는 전체를 아인슈타인 합 방식으로 변환하여 상기 데이터 분석을 수행하는 텐서 분석 엔진을 포함하여 구성되는 것을 특징으로 하는 데이터 분석 장치
|
11 |
11
제 10 항에 있어서, 상기 데이터 변환부는상기 텐서 데이터를 희소형으로 표현한 경우 요구되는 총 데이터 양을 산출하고, 상기 텐서 데이터를 밀도형으로 표현한 경우 요구되는 총 데이터 공간을 산출한 후, 상기 총 데이터 양과 상기 총 데이터 공간과의 비율이 상기 임계값보다 작으면 상기 텐서 데이터를 희소형의 데이터로 변환하고, 작지 않으면 밀도형의 데이터로 변환하는 것을 특징으로 하는 데이터 분석 장치
|
12 |
12
제 10 항에 있어서, 상기 임계값은 사용자가 임의로 지정하거나 자동으로 지정되는 것을 특징으로 하는 데이터 분석 장치
|
13 |
13
제 10 항에 있어서, 상기 메타 데이터는 관리하는 텐서의 이름, 소유권자, 생성일시, 억세스권, 차원, 밀도, 희소도, 상기 분산 시스템에 저장된 데이터의 위치, 및 억세스 방법 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터 분석 장치
|
14 |
14
제 10 항에 있어서, 상기 텐서 분석 엔진은상기 아인슈타인 합 방식으로 분석 알고리즘을 수행하는 경우, 밀도형 데이터와 희소형 데이터를 선택적으로 지정하여 처리하는 것을 특징으로 하는 데이터 분석 장치
|
15 |
15
제 10 항에 있어서, 상기 분석 알고리즘은 상기 분석 라이브러리에서 호출하는 것을 특징으로 하는 데이터 분석 장치
|
16 |
16
제 10 항에 있어서,상기 분석 라이브러리에서 제공하는 라이브러리는 데이터 클러스터링과 패턴 분석을 포함하는 것을 특징으로 하는 데이터 분석 장치
|
17 |
17
제 10 항에 있어서,상기 분석 알고리즘은 상기 사용자 분석부에서 사용자에 의해 제작된 사용자 정의 함수(UDF)를 사용하여 확장되는 것을 특징으로 하는 데이터 분석 장치
|
18 |
18
제 8 항에 있어서, 상기 대용량 텐서 분석 엔진에는 복수개의 사용자 분석부가 동시 접속되어 상기 데이터를 공유하는 것을 특징으로 하는 데이터 분석 장치
|
19 |
19
사용자 분석툴로부터 텐서 데이터가 원격으로 전송되면 기 설정된 임계값을 기반으로 상기 텐서 데이터를 밀도형과 희소형 중 하나의 데이터로 변환한 후 분산 시스템에 분배하여 저장하고, 상기 저장된 데이터에 대한 메타 데이터를 기록하며, 상기 사용자 분석툴로부터 분석 명령이 전송되면 분석 알고리즘을 수행하여 상기 저장된 데이터를 분석하는 프로그램을 저장하는 저장 매체
|
20 |
20
제 19 항에 있어서, 상기 데이터를 변환하는 것은 상기 텐서 데이터를 희소형으로 표현한 경우 요구되는 총 데이터 양을 산출하고, 상기 텐서 데이터를 밀도형으로 표현한 경우 요구되는 총 데이터 공간을 산출한 후, 상기 총 데이터 양과 상기 총 데이터 공간과의 비율이 상기 임계값보다 작으면 상기 텐서 데이터를 희소형의 데이터로 변환하고, 작지 않으면 밀도형의 데이터로 변환하는 것을 특징으로 하는 저장 매체
|