1 |
1
하나 이상의 프로세서들, 및상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 방법으로서, 주제(Subject), 술어(Predicate), 및 객체(Object)로 구성된 복수 개의 트리플(Triple)을 포함하는 RDF(Resource Description Framework) 데이터를 직렬화 하는 단계;상기 직렬화 된 트리플들을 재배열하여 상기 직렬화된 트리플들에서 중복되는 부분을 감소시키는 단계; 및상기 재배열된 트리플들을 압축시키는 단계를 포함하는, RDF 데이터 압축 방법
|
2 |
2
청구항 1에 있어서, 상기 중복되는 부분을 감소시키는 단계는,상기 직렬화 된 트리플들을 동일한 주제를 기준으로 그룹화 하여 상기 트리플들을 트리 형태로 배열하는 단계;상기 트리 형태의 배열에서 동일한 술어 세트를 그룹화 하고, 그룹화 된 상기 술어 세트에 ID를 부여하는 단계; 및상기 트리 형태의 배열에서 상기 술어 세트의 ID가 동일한 주제끼리 그룹화하여 재배열하는 단계를 포함하는, RDF 데이터 압축 방법
|
3 |
3
청구항 2에 있어서, 상기 중복되는 부분을 감소시키는 단계는,상기 재배열된 각 주제의 ID를 순차적으로 배열하여 주제 매핑 시퀀스를 생성하는 단계를 더 포함하는, RDF 데이터 압축 방법
|
4 |
4
청구항 2에 있어서, 상기 중복되는 부분을 감소시키는 단계는,상기 재배열된 주제들을 상기 술어 세트의 ID가 동일한 그룹 별로 각 주제에 대해 새로운 ID를 부여하는 단계; 및상기 그룹 별로 각 주제에 대해 원본 ID와 상기 새로운 ID를 매핑하여 저장하는 단계를 더 포함하는, RDF 데이터 압축 방법
|
5 |
5
청구항 4에 있어서, 상기 압축시키는 단계는, 상기 재배열된 트리플들에서 각 주제 별 트리에 따른 트리플 값을 추출하여 순차적으로 배열하는 단계;상기 각 주제 별 트리의 트리플들에 대한 합계 값(Summed Value)을 산출하는 단계; 및상기 산출한 합계 값에 기반하여 각 주제 별 트리의 트리플들을 기 설정된 형태의 데이터로 재구성하는 단계를 포함하는, RDF 데이터 압축 방법
|
6 |
6
청구항 5에 있어서, 상기 합계 값은, 해당 주제의 새로 부여된 ID 값과 해당 주제의 트리플들 중 객체의 ID 값을 합산하여 산출하는, RDF 데이터 압축 방법
|
7 |
7
청구항 5에 있어서, 상기 재구성하는 단계는, 상기 각 주제 별 트리의 트리플들을 003c#합계 값, {주제(Subject), 객체1(Object1), 객체2(Object2),
|
8 |
8
청구항 7에 있어서, 상기 압축시키는 단계는, 상기 각 주제 별 트리의 트리플들에 대한 재구성 데이터에서 동일한 합계 값이 존재하는 경우, 중복되는 객체의 값을 빈 문자열로 대체하는 단계를 더 포함하는, RDF 데이터 압축 방법
|
9 |
9
청구항 2에 있어서, 상기 RDF 데이터 압축 방법은, 상기 술어 세트의 그룹별로 해당 그룹에 속하는 술어들에 대응하도록 상기 트리플들의 객체를 1차 재배열하는 단계;상기 술어 세트를 구성하는 각 술어 별로 순차적으로 그에 대응하는 객체를 2차 재배열하는 단계; 및상기 2차 재배열된 객체의 값들을 원래의 값보다 작은 범위의 값으로 정규화하여 매핑시키는 단계를 더 포함하는, RDF 데이터 압축 방법
|
10 |
10
청구항 1에 있어서, 상기 RDF 데이터는, 복수 개의 지명 그래프를 포함하고,상기 RDF 데이터 압축 방법은, 상기 RDF 데이터를 직렬화 할 때, HDT 사전(HDT Dictionary)에 상기 지명 그래프들의 그래프 이름을 나타내기 위한 섹션을 추가하는 단계; 및상기 지명 그래프들에 특정 트리플이 있는지 여부를 나타내기 위한 그래프 정보를 생성하는 단계를 더 포함하는, RDF 데이터 압축 방법
|
11 |
11
청구항 10에 있어서, 상기 그래프 정보를 생성하는 단계는, 트리플 인터프리터를 통해 각 트리플을 기준으로 해당 트리플이 존재하는 지명 그래프를 비트맵으로 생성하는 단계; 및그래프 인터프리터를 통해 각 지명 그래프를 기준으로 각 지명 그래프가 어떤 트리플을 가지는지를 비트맵으로 생성하는 단계를 포함하는, RDF 데이터 압축 방법
|
12 |
12
주제(Subject), 술어(Predicate), 및 객체(Object)로 구성된 복수 개의 트리플(Triple)을 포함하는 RDF(Resource Description Framework) 데이터를 직렬화 하는 HDT 확장 모듈;상기 직렬화 된 트리플들을 재배열하여 상기 직렬화된 트리플들에서 중복되는 부분을 감소시키는 중복 감소 모듈; 및상기 재배열된 트리플들을 압축시키는 압축 모듈을 포함하는, RDF 데이터 압축 장치
|
13 |
13
청구항 12에 있어서, 상기 중복 감소 모듈은, 상기 직렬화 된 트리플들을 동일한 주제를 기준으로 그룹화 하여 상기 트리플들을 트리 형태로 배열하고, 상기 트리 형태의 배열에서 동일한 술어 세트를 그룹화 하고 그룹화 된 상기 술어 세트에 ID를 부여하며, 상기 트리 형태의 배열에서 상기 술어 세트의 ID가 동일한 주제끼리 그룹화하여 재배열하는, RDF 데이터 압축 장치
|
14 |
14
청구항 13에 있어서, 상기 중복 감소 모듈은, 상기 재배열된 각 주제의 ID를 순차적으로 배열하여 주제 매핑 시퀀스를 생성하는, RDF 데이터 압축 장치
|
15 |
15
청구항 13에 있어서, 상기 중복 감소 모듈은, 상기 재배열된 주제들을 상기 술어 세트의 ID가 동일한 그룹 별로 각 주제에 대해 새로운 ID를 부여하고, 상기 그룹 별로 각 주제에 대해 원본 ID와 상기 새로운 ID를 매핑하여 저장하는, RDF 데이터 압축 장치
|
16 |
16
청구항 15에 있어서, 상기 압축 모듈은, 상기 재배열된 트리플들에서 각 주제 별 트리에 따른 트리플 값을 추출하여 순차적으로 배열하고, 상기 각 주제 별 트리의 트리플들에 대한 합계 값(Summed Value)을 산출하며, 상기 산출한 합계 값에 기반하여 각 주제 별 트리의 트리플들을 기 설정된 형태의 데이터로 재구성하는, RDF 데이터 압축 장치
|
17 |
17
청구항 16에 있어서, 상기 합계 값은, 해당 주제의 새로 부여된 ID 값과 해당 주제의 트리플들 중 객체의 ID 값을 합산하여 산출하는, RDF 데이터 압축 장치
|
18 |
18
청구항 16에 있어서, 상기 압축 모듈은, 상기 각 주제 별 트리의 트리플들을 003c#합계 값, {주제(Subject), 객체1(Object1), 객체2(Object2),
|
19 |
19
청구항 18에 있어서, 상기 압축 모듈은, 상기 각 주제 별 트리의 트리플들에 대한 재구성 데이터에서 동일한 합계 값이 존재하는 경우, 중복되는 객체의 값을 빈 문자열로 대체하는, RDF 데이터 압축 장치
|
20 |
20
청구항 13에 있어서, 상기 RDF 데이터 압축 장치는, 상기 술어 세트의 그룹별로 해당 그룹에 속하는 술어들에 대응하도록 상기 트리플들의 객체를 1차 재배열하고, 상기 술어 세트를 구성하는 각 술어 별로 순차적으로 그에 대응하는 객체를 2차 재배열하며, 상기 2차 재배열된 객체의 값들을 원래의 값보다 작은 범위의 값으로 정규화하여 매핑시키는 객체 매핑 모듈을 더 포함하는, RDF 데이터 압축 장치
|
21 |
21
청구항 20에 있어서, 상기 RDF 데이터는, 복수 개의 지명 그래프를 포함하고,상기 HDT 확장 모듈은,상기 RDF 데이터를 직렬화 할 때, HDT 사전(HDT Dictionary)에 상기 지명 그래프들의 그래프 이름을 나타내기 위한 섹션을 추가하고, 상기 지명 그래프들에 특정 트리플이 있는지 여부를 나타내기 위한 그래프 정보를 생성하는, RDF 데이터 압축 장치
|
22 |
22
청구항 21에 있어서, 상기 HDT 확장 모듈은, 상기 그래프 정보 생성 시, 트리플 인터프리터를 통해 각 트리플을 기준으로 해당 트리플이 존재하는 지명 그래프를 비트맵으로 생성하고, 그래프 인터프리터를 통해 각 지명 그래프를 기준으로 각 지명 그래프가 어떤 트리플을 가지는지를 비트맵으로 생성하는, RDF 데이터 압축 장치
|
23 |
23
비일시적 컴퓨터 판독 가능한 저장 매체(non-transitory computer readable storage medium)에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 명령어들을 포함하고, 상기 명령어들은 하나 이상의 프로세서들을 갖는 컴퓨팅 장치에 의해 실행될 때, 상기 컴퓨팅 장치로 하여금, 주제(Subject), 술어(Predicate), 및 객체(Object)로 구성된 복수 개의 트리플(Triple)을 포함하는 RDF(Resource Description Framework) 데이터를 직렬화 하는 단계;상기 직렬화 된 트리플들을 재배열하여 상기 직렬화된 트리플들에서 중복되는 부분을 감소시키는 단계; 및상기 재배열된 트리플들을 압축시키는 단계를 수행하도록 하는, 컴퓨터 프로그램
|