1 |
1
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷을 생성하는 데이터 버킷 생성부;
상기 복수 개의 문서로부터 추출한 검색어 및 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트를 생성하는 인덱스 리스트 생성부;
상기 검색어, 상기 검색어가 포함된 문서의 주소 정보 및 상기 검색어가 포함된 문서가 속하는 데이터 버킷의 주소 정보를 포함하는 리스트 버킷을 생성하는 리스트 버킷 생성부;
상기 검색어 및 상기 검색어가 포함된 리스트 버킷의 주소 정보로 이루어진 인덱스 트리를 생성하되, 상기 인덱스 트리를 구성하는 각각의 노드에는 한 개 이상의 상기 검색어가 순차적으로 정렬되는 인덱스 트리 생성부;
상기 인덱스 트리의 노드에 대응되는 검색어, 상기 검색어가 포함된 리스트 버킷의 주소 정보 및 상기 노드의 하위에 위치하는 자식 노드의 주소 정보를 포함하는 트리 버킷을 생성하는 트리 버킷 생성부;
상기 트리 버킷, 상기 리스트 버킷 및 상기 데이터 버킷을 순차적으로 배치하여 부호화될 데이터를 생성하는 다중화부; 및
상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 데이터량 및 상기 다중화부에 의해 생성되는 부호화될 데이터의 전송 속도를 기초로 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 시간 정보로 변환하는 시간 정보 산출부;를 포함하며,
상기 데이터 버킷 생성부, 상기 리스트 버킷 생성부 및 상기 트리 버킷 생성부는 각각에 대응하는 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 상기 시간 정보 산출부가 산출한 시간 정보로 변경하는 것을 특징으로 하는 데이터 생성 장치
|
2 |
2
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷을 생성하는 데이터 버킷 생성부;
상기 복수 개의 문서로부터 추출한 검색어 및 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트를 생성하는 인덱스 리스트 생성부;
상기 검색어, 상기 검색어가 포함된 문서의 주소 정보 및 상기 검색어가 포함된 문서가 속하는 데이터 버킷의 주소 정보를 포함하는 리스트 버킷을 생성하는 리스트 버킷 생성부;
상기 검색어로 이루어진 인덱스 트리를 생성하되, 상기 인덱스 트리를 구성하는 각각의 노드에는 한 개 이상의 상기 검색어가 순차적으로 정렬되며, 상기 인덱스 트리의 리프 노드(leaf node)에는 상기 검색어가 포함된 리스트 버킷의 주소가 포함되는 인덱스 트리 생성부;
상기 인덱스 트리의 노드에 대응되는 검색어 및 상기 노드의 하위에 위치하는 자식 노드의 주소 정보를 포함하는 트리 버킷을 생성하되, 상기 트리 버킷이 상기 인덱스 트리의 리프 노드로부터 생성된 경우에는 상기 검색어가 포함된 리스트 버킷의 주소 정보를 더 포함하도록 하는 트리 버킷 생성부;
상기 트리 버킷, 상기 리스트 버킷 및 상기 데이터 버킷을 순차적으로 배치하여 부호화될 데이터를 생성하는 다중화부; 및
상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 데이터량 및 상기 다중화부에 의해 생성되는 부호화될 데이터의 전송 속도를 기초로 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 시간 정보로 변환하는 시간 정보 산출부;를 포함하며,
상기 데이터 버킷 생성부, 상기 리스트 버킷 생성부 및 상기 트리 버킷 생성부는 각각에 대응하는 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 상기 시간 정보 산출부가 산출한 시간 정보로 변경하는 것을 특징으로 하는 데이터 생성 장치
|
3 |
3
제 1항 또는 제 2항에 있어서,
상기 데이터 버킷 생성부는 사전에 설정된 트리 복제 횟수와 리스트 복제 횟수를 곱한 횟수로 상기 데이터 버킷을 분할하여 복수의 부분 데이터 버킷을 생성하고,
상기 리스트 버킷 생성부는 상기 트리 복제 횟수로 상기 리스트 버킷을 분할하여 복수의 부분 리스트 버킷을 생성한 후 상기 리스트 복제 횟수에 따라 상기 각각의 부분 리스트 버킷을 복제하고,
상기 트리 버킷 생성부는 상기 트리 복제 횟수와 리스트 복제 횟수를 곱한 횟수에 따라 상기 트리 버킷을 복제하며,
상기 다중화부는 상기 각각의 트리 버킷, 부분 리스트 버킷 및 부분 데이터 버킷을 순차적으로 반복 배치하여 부호화될 데이터를 생성하는 것을 특징으로 하는 데이터 생성 장치
|
4 |
4
제 3항에 있어서,
상기 트리 복제 횟수 및 리스트 복제 횟수는 다음의 수학식에 의해 결정되는 것을 특징으로 하는 데이터 생성 장치:
[수학식 A]
[수학식 B]
여기서, AvgAT(1,α(1,β))는 상기 다중화부에 의하여 생성된 후 부호화되어 전송되는 데이터 스트림을 다운로드하여 상기 검색어가 포함된 문서를 추출하기까지의 시간, SizeOfIndexList는 상기 인덱스 리스트로부터 생성된 상기 리스트 버킷의 수, DBSize는 상기 콘텐츠 데이터로부터 생성된 상기 데이터 버킷의 수, SizeOfIndexTree는 상기 인덱스 트리로부터 생성된 상기 트리 버킷의 수, α는 AvgAT(1,α(1,β))를 최소화시키는 값으로서 상기 리스트 복제 횟수, 그리고 β는 상기 트리 복제 횟수이다
|
5 |
5
제 1항에 있어서,
상기 트리 버킷 생성부는 상기 인덱스 트리의 각 노드를 전위(pre-order) 방식으로 순회하여 상기 트리 버킷을 생성하는 것을 특징으로 하는 데이터 생성 장치
|
6 |
6
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷을 생성하는 데이터 버킷 생성 단계;
상기 복수 개의 문서로부터 추출한 검색어 및 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트를 생성하는 인덱스 리스트 생성 단계;
상기 검색어, 상기 검색어가 포함된 문서의 주소 정보 및 상기 검색어가 포함된 문서가 속하는 데이터 버킷의 주소 정보를 포함하는 리스트 버킷을 생성하는 리스트 버킷 생성 단계;
상기 검색어 및 상기 검색어가 포함된 리스트 버킷의 주소 정보로 이루어진 인덱스 트리를 생성하되, 상기 인덱스 트리를 구성하는 각각의 노드에는 한 개 이상의 상기 검색어가 순차적으로 정렬되는 인덱스 트리 생성 단계;
상기 인덱스 트리의 노드에 대응되는 검색어, 상기 검색어가 포함된 리스트 버킷의 주소 정보 및 상기 노드의 하위에 위치하는 자식 노드의 주소 정보를 포함하는 트리 버킷을 생성하는 트리 버킷 생성 단계;
상기 트리 버킷, 상기 리스트 버킷 및 상기 데이터 버킷을 순차적으로 배치하여 부호화될 데이터를 생성하는 다중화 단계; 및
상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 데이터량 및 상기 다중화 단계에서 생성되는 부호화될 데이터의 전송 속도를 기초로 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 시간 정보로 변환하는 시간 정보 산출 단계;를 포함하며,
상기 데이터 버킷 생성 단계, 상기 리스트 버킷 생성 단계 및 상기 트리 버킷 생성 단계에서 각각에 대응하는 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 상기 시간 정보 산출 단계에서 산출된 시간 정보로 변경하는 것을 특징으로 하는 데이터 생성 방법
|
7 |
7
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷을 생성하는 데이터 버킷 생성 단계;
상기 복수 개의 문서로부터 추출한 검색어 및 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트를 생성하는 인덱스 리스트 생성 단계;
상기 검색어, 상기 검색어가 포함된 문서의 주소 정보 및 상기 검색어가 포함된 문서가 속하는 데이터 버킷의 주소 정보를 포함하는 리스트 버킷을 생성하는 리스트 버킷 생성 단계;
상기 검색어로 이루어진 인덱스 트리를 생성하되, 상기 인덱스 트리를 구성하는 각각의 노드에는 한 개 이상의 상기 검색어가 순차적으로 정렬되며, 상기 인덱스 트리의 리프 노드에는 상기 검색어가 포함된 리스트 버킷의 주소가 포함되는 인덱스 트리 생성 단계;
상기 인덱스 트리의 노드에 대응되는 검색어 및 상기 노드의 하위에 위치하는 자식 노드의 주소 정보를 포함하는 트리 버킷을 생성하되, 상기 트리 버킷이 상기 인덱스 트리의 리프 노드로부터 생성된 경우에는 상기 검색어가 포함된 리스트 버킷의 주소 정보를 더 포함하도록 하는 트리 버킷 생성 단계;
상기 트리 버킷, 상기 리스트 버킷 및 상기 데이터 버킷을 순차적으로 배치하여 부호화될 데이터를 생성하는 다중화 단계; 및
상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 데이터량 및 상기 다중화 단계에서 생성되는 부호화될 데이터의 전송 속도를 기초로 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 시간 정보로 변환하는 시간 정보 산출 단계;를 포함하며,
상기 데이터 버킷 생성 단계, 상기 리스트 버킷 생성 단계 및 상기 트리 버킷 생성 단계에서 각각에 대응하는 상기 데이터 버킷, 리스트 버킷 및 트리 버킷의 주소 정보를 상기 시간 정보 산출 단계에서 산출된 시간 정보로 변경하는 것을 특징으로 하는 데이터 생성 방법
|
8 |
8
제 7항 또는 제 8항에 있어서,
상기 데이터 버킷 생성 단계에서 사전에 설정된 트리 복제 횟수와 리스트 복제 횟수를 곱한 횟수로 상기 데이터 버킷을 분할하여 복수의 부분 데이터 버킷을 생성하고,
상기 리스트 버킷 생성 단계에서 상기 트리 복제 횟수로 상기 리스트 버킷을 분할하여 복수의 부분 리스트 버킷을 생성한 후 상기 리스트 복제 횟수에 따라 상기 각각의 부분 리스트 버킷을 복제하고,
상기 트리 버킷 생성 단계에서 상기 트리 복제 횟수와 리스트 복제 횟수를 곱한 횟수에 따라 상기 트리 버킷을 복제하며,
상기 다중화 단계에서 상기 각각의 트리 버킷, 부분 리스트 버킷 및 부분 데이터 버킷을 순차적으로 반복 배치하여 부호화될 데이터를 생성하는 것을 특징으로 하는 데이터 생성 방법
|
9 |
9
제 8항에 있어서,
상기 트리 복제 횟수 및 리스트 복제 횟수는 다음의 수학식에 의해 결정되는 것을 특징으로 하는 데이터 생성 방법:
[수학식 A]
[수학식 B]
여기서, AvgAT(1,α(1,β))는 상기 다중화 단계에서 생성된 후 부호화되어 전송되는 데이터 스트림을 다운로드하여 상기 검색어가 포함된 문서를 추출하기까지의 시간, SizeOfIndexList는 상기 인덱스 리스트로부터 생성된 상기 리스트 버킷의 수, DBSize는 상기 콘텐츠 데이터로부터 생성된 상기 데이터 버킷의 수, SizeOfIndexTree는 상기 인덱스 트리로부터 생성된 상기 트리 버킷의 수, α는 AvgAT(1,α(1,β))를 최소화시키는 값으로서 상기 리스트 복제 횟수, 그리고 β는 상기 트리 복제 횟수이다
|
10 |
10
제 6항에 있어서,
상기 트리 버킷 생성 단계에서 상기 인덱스 트리의 각 노드를 전위(pre-order) 방식으로 순회하여 상기 트리 버킷을 생성하는 것을 특징으로 하는 데이터 생성 방법
|
11 |
11
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷, 상기 복수 개의 문서로부터 추출한 검색어 및 상기 데이터 버킷 내에서 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트로부터 생성된 리스트 버킷, 그리고 상기 검색어 및 상기 검색어가 속하는 리스트 버킷의 주소 정보로 이루어진 인덱스 트리의 각 노드로부터 생성된 트리 버킷을 포함하는 데이터 스트림을 전송 채널로부터 수신하는 데이터 수신부;
상기 데이터 스트림으로부터 추출한 트리 버킷에 포함된 상기 리스트 버킷의 주소 정보에 의하여 파악되는 수신 시점에 상기 리스트 버킷을 추출하고, 상기 리스트 버킷에 포함된 상기 데이터 버킷의 주소 정보에 의하여 파악되는 수신 시점에 상기 데이터 버킷을 추출하는 버킷 추출부;
상기 데이터 버킷에 포함된 상기 문서의 주소 정보에 의해 파악되는 수신 시점에 상기 데이터 버킷으로부터 상기 검색어를 포함하는 문서를 추출하는 데이터 추출부; 및
상기 데이터 버킷으로부터 추출한 문서에 포함된 상기 검색어에 별도의 표시를 하여 상기 문서를 출력하는 검색부;를 포함하는 것을 특징으로 하는 데이터 검색 장치
|
12 |
12
제 11항에 있어서,
사용자로부터 입력받은 질의어와 상기 검색어가 일치하는 경우에 상기 버킷 추출부가 동작하도록 하는 제어부를 더 포함하는 것을 특징으로 하는 데이터 검색 장치
|
13 |
13
제 11항에 있어서,
상기 트리 버킷이 상기 인덱스 트리의 각각의 노드를 전위 방식으로 순회하여 생성되는 복수의 트리 버킷이 순차적으로 배치된 트리 버킷 스트림의 처음 부분에 해당하지 않는 경우에는 다음 트리 버킷 스트림의 수신 시점까지 대기하는 것을 특징으로 하는 데이터 검색 장치
|
14 |
14
제 11항 내지 제 13항 중 어느 한 항에 있어서,
상기 리스트 버킷이 상기 인덱스 리스트에 포함되어 순차적으로 정렬된 검색어들 중 처음 부분에 해당하는 검색어로부터 생성된 것이 아닌 경우에는 다음 인덱스 리스트의 수신 시점까지 대기하는 것을 특징으로 하는 데이터 검색 장치
|
15 |
15
복수 개의 문서로 구성된 콘텐츠 데이터를 포함하는 데이터 버킷, 상기 복수 개의 문서로부터 추출한 검색어 및 상기 데이터 버킷 내에서 상기 검색어가 포함된 문서의 주소 정보로 이루어진 인덱스 리스트로부터 생성된 리스트 버킷, 그리고 상기 검색어 및 상기 검색어가 속하는 리스트 버킷의 주소 정보로 이루어진 인덱스 트리의 각 노드로부터 생성된 트리 버킷을 포함하는 데이터 스트림을 전송 채널로부터 수신하는 데이터 수신 단계;
상기 데이터 스트림으로부터 추출한 트리 버킷에 포함된 상기 리스트 버킷의 주소 정보에 의하여 파악되는 수신 시점에 상기 리스트 버킷을 추출하고, 상기 리스트 버킷에 포함된 상기 데이터 버킷의 주소 정보에 의하여 파악되는 수신 시점에 상기 데이터 버킷을 추출하는 버킷 추출 단계;
상기 데이터 버킷에 포함된 상기 문서의 주소 정보에 의해 파악되는 수신 시점에 상기 데이터 버킷으로부터 상기 검색어를 포함하는 문서를 추출하는 데이터 추출 단계; 및
상기 데이터 버킷으로부터 추출한 문서에 포함된 상기 검색어에 별도의 표시를 하여 상기 문서를 출력하는 검색 단계;를 포함하는 것을 특징으로 하는 데이터 검색 방법
|
16 |
16
제 15항에 있어서,
사용자로부터 입력받은 질의어와 상기 검색어가 일치하는 경우에 상기 버킷 추출 단계에서 상기 리스트 버킷 및 데이터 버킷을 추출하도록 하는 제어 단계를 더 포함하는 것을 특징으로 하는 데이터 검색 방법
|
17 |
17
제 15항에 있어서,
상기 트리 버킷이 상기 인덱스 트리의 각각의 노드를 전위 방식으로 순회하여 생성되는 복수의 트리 버킷이 순차적으로 배치된 트리 버킷 스트림의 처음 부분에 해당하지 않는 경우에는 다음 트리 버킷 스트림의 수신 시점까지 대기하는 것을 특징으로 하는 데이터 검색 방법
|
18 |
18
제 15항 내지 제 17항 중 어느 한 항에 있어서,
상기 리스트 버킷이 상기 인덱스 리스트에 포함되어 순차적으로 정렬된 검색어들 중 처음 부분에 해당하는 검색어로부터 생성된 것이 아닌 경우에는 다음 인덱스 리스트의 수신 시점까지 대기하는 것을 특징으로 하는 데이터 검색 방법
|
19 |
19
제 6항 또는 제 7항에 기재된 데이터 생성 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|
20 |
20
제 15항에 기재된 데이터 검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|