1 |
1
트라이앵글 카운팅 기법(Triangle counting Algorithm)으로 연결된 세노드(node)를 찾는 방법에 있어서,데이터마이닝 엔진이 트라이앵글 카운팅 모듈을 통하여 전체 데이터에서 각 노드들의 출현 빈도를 카운팅하는 단계와;두 개의 빈도수를 가지는 에지(Edge)로 이루어진 각 데이터들을 통해 상기 에지로 연결된 2노드 중 연결 에지수의 최소값을 취하는 단계와;상기 노드들의 출현 빈도에 따라 빈도에 비례하는 확률로 상기 에지의 샘플링(sampling) 확률을 서브그래프(subgraph)로 형성하는 단계와;상기 트라이앵글 카운팅 기법을 이용하여 상기 서브그래프에서 삼각형을 카운팅하는 단계;로 이루어지는 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 방법
|
2 |
2
제1항에 있어서,하둡(Hadoop)의 맵-리듀스(Map-Reduce)를 이용하여 상기 노드들의 작업을 병렬로 처리하는 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 방법
|
3 |
3
제1항에 있어서,상기 서브그래프는,분석 대상 그래프 G(V,E)에서 샘플링 과정을 거친 (V : vertex 값, E : edge 값)인 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 방법
|
4 |
4
제1항에 있어서,상기 노드들의 출현 빈도에 따라 빈도에 비례하는 확률로 상기 에지의 샘플링(sampling) 확률을 서브그래프(subgraph)로 형성하는 단계에서, 빈도 측정 공식은 아래 003c#수학식2003e#인 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 방법
|
5 |
5
맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 장치에 있어서,데이터마이닝 엔진을 포함하되,상기 데이터마이닝 엔진은,전체 데이터에서 각 노드들의 출현 빈도를 카운팅하는 트라이앵글 카운팅 모듈;로 구성되며,두 개의 빈도수를 가지는 에지(Edge)로 이루어진 각 데이터들을 통해 상기 에지로 연결된 2노드 중 연결 에지수의 최소값을 취하고, 상기 노드들의 출현 빈도에 따라 빈도에 비례하는 확률로 상기 에지의 샘플링(sampling) 확률을 서브그래프(subgraph)로 형성하여, 상기 트라이앵글 카운팅 기법을 이용하여 상기 서브그래프에서 삼각형을 카운팅하는 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 장치
|
6 |
6
제5항에 있어서,상기 데이터마이닝 엔진은,하둡(Hadoop)의 맵-리듀스(Map-Reduce)를 이용하여 상기 노드들의 작업을 병렬로 처리하는 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 장치
|
7 |
7
제6항에 있어서,상기 서브그래프는,분석 대상 그래프 G(V,E)에서 샘플링 과정을 거친 (V : vertex 값, E : edge 값)인 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 장치
|
8 |
8
제6항에 있어서,상기 데이터마이닝 엔진은, 상기 노드들의 출현 빈도에 따라 빈도에 비례하는 확률로 상기 에지의 샘플링(sampling) 확률을 서브그래프(subgraph)로 형성하기 위한 빈도 측정 공식은 아래 003c#수학식2003e#인 것을 특징으로 하는 맵 리듀스를 이용한 트라이앵글 카운팅 샘플링 장치
|