1 |
1
다양성 인덱스 기반의 검색 장치를 이용한 검색 방법에 있어서,복수의 키워드가 조합된 질의어에 대응하여 도출된 문서 검색 리스트 내 문서들 각각을 대상으로, 상기 복수의 키워드 중 문서 내 존재하는 키워드를 각각 원소로 하는 키워드 집합을 생성하는 단계:전체 키워드 집합에 대해 상기 원소로 소속된 빈도가 높은 키워드를 분석하고 상기 빈도 순으로 상기 키워드 집합 내 원소의 나열 순서를 변경하는 단계;상기 문서들 각각에 대해 구축된 상기 키워드 집합 내 원소의 종류 및 나열 순서를 기초로 상기 문서들 간의 연관 관계를 계층 구조로 정의한 인덱스 트리를 생성하는 단계; 상기 생성한 인덱스 트리의 구조를 기반으로 상기 문서들을 복수의 그룹으로 구분하는 단계;상기 인덱스 트리 내의 각 노드의 위치 및 연결 관계를 기초로 상기 문서 검색 리스트 내 문서들의 표출 순서를 재정렬하는 단계; 상기 재정렬된 표출 순서대로 상기 문서 검색 리스트를 제공하는 단계;상기 제공된 문서 검색 리스트 내에서 노이즈 문서로 분석된 제1 문서가 사용자로부터 선택되면, 상기 인덱스 트리 내에서 상기 제1 문서에 대응된 제1 하위 노드로부터 다른 그룹 내의 대표 하위 노드까지의 거리를 각각 연산하여, 상기 거리 및 상기 대표 하위 노드에 매핑된 라벨링값을 조합하여 다양성 지수를 연산하는 단계; 및 상기 문서들 중 상기 다양성 지수가 가장 높은 그룹에 속한 문서들이 문서 검색 리스트 상의 상위에 노출되도록, 상기 문서들의 표출 순서를 수정하는 단계를 포함하며,상기 다양성 지수(Ok)는 아래 수학식에 의해 연산되는 문서 검색 방법:여기서, λ는 0과 1 사이에서 결정되는 가중치, D는 상기 제1 하위 노드와 상기 다른 그룹 내의 대표 하위 노드 사이의 노드 간 거리, R은 상기 대표 하위 노드 상에 매핑된 라벨링값을 나타낸다
|
2 |
2
청구항 1에 있어서,상기 키워드 집합 내 원소의 나열 순서를 변경하는 단계는,임계치 이하의 빈도로 분석된 키워드를 상기 키워드 집합에서 제거하는 문서 검색 방법
|
3 |
3
청구항 1에 있어서,상기 인덱스 트리를 생성하는 단계는,상기 문서 별로 구축된 상기 키워드 집합에 대한 상기 원소의 나열 순서를 기초로 뿌리 노드로부터 분기되는 트리 구조를 생성하되, 상기 키워드 집합 내 최우선 순위의 원소에 대응하여 상기 뿌리 노드에 직접 연결되는 최상위 노드를 생성한 후, 차순위의 원소에 대응하여 상기 최상위 노드에 대한 하위 노드를 차례로 생성하며, 상기 생성 과정에서 상기 최우선 순위의 원소가 동종인 문서들 간에는 상기 최상위 노드를 하나의 공통 노드로 통합하여 하위 노드를 개별 분기시키고, 분기 과정에서 차순위의 원소도 동종이면 해당하는 하위 노드를 하나의 공통 노드로 통합한 후에 다음의 하위 노드를 개별 분기시키는 문서 검색 방법
|
4 |
4
청구항 3에 있어서,상기 인덱스 트리를 생성하는 단계는, 상기 최상위 노드 및 하위 노드 각각에 대해 대응 원소의 종류 및 라벨링값을 포함한 인덱싱 정보를 매핑하며, 상기 라벨링값은 노드의 초기 생성 시에 제1 값을 가지며 상기 통합이 발생할 때마다 제1 값 씩 증가되는 문서 검색 방법
|
5 |
5
청구항 4에 있어서,상기 인덱스 트리를 생성하는 단계는, 상기 최상위 노드에 각각 매핑된 라벨링값을 기초로 상기 뿌리 노드로부터 분기된 최상위 노드들의 배열 순서를 정렬하고, 하위 노드들에 각각 매핑된 라벨링값을 기초로 직전 노드에서 분기된 하위 노드들의 배열 순서를 정렬한 다음, 상기 인덱스 트리 상의 하위 노드를 대상으로, 해당 하위 노드로부터 상위의 모든 노드까지의 경로에 대응하는 원소들을 상기 키워드 집합 내 소속 원소로 하는 해당 문서의 고유 넘버를 상기 해당 하위 노드에 최종 매핑하는 문서 검색 방법
|
6 |
6
청구항 5에 있어서,상기 표출 순서를 재정렬하는 단계는, 상기 하위 노드 각각에 매핑된 문서의 고유 넘버, 상기 최상위 노드들의 좌우 배열 순서, 그리고 문서의 고유 넘버가 매핑된 각 하위 노드의 트리 깊이를 이용하여 상기 문서들의 표출 순서를 재정렬하되, 트리 좌측에 위치한 최상위 노드에 대한 하위의 노드 그룹일수록, 그리고 동일한 그룹 내에서 낮은 트리 깊이를 갖는 하위 노드일수록, 해당 노드의 문서를 상위로 정렬시키는 문서 검색 방법
|
7 |
7
삭제
|
8 |
8
삭제
|
9 |
9
청구항 1에 있어서,상기 그룹 내 대표 하위 노드는, 상기 그룹 내에서 상기 문서가 매핑된 하위 노드 중 가장 낮은 트리 깊이를 갖는 하위 노드를 나타내며,상기 표출 순서를 수정하는 단계는,상기 제1 하위 노드가 소속된 제1 그룹의 문서를 문서 검색 리스트 상의 최하위로 이동시키는 문서 검색 방법
|
10 |
10
검색 결과 다양성 인덱스 기반의 효율적 검색 장치에 있어서,복수의 키워드가 조합된 질의어에 대응하여 도출된 문서 검색 리스트 내 문서들 각각을 대상으로, 상기 복수의 키워드 중 문서 내 존재하는 키워드를 각각 원소로 하는 키워드 집합을 생성하는 키워드 집합 생성부:전체 키워드 집합에 대해 상기 원소로 소속된 빈도가 높은 키워드를 분석하고 상기 빈도 순으로 상기 키워드 집합 내 원소의 나열 순서를 변경하는 키워드 정렬부;상기 문서들 각각에 대해 구축된 상기 키워드 집합 내 원소의 종류 및 나열 순서를 기초로 상기 문서들 간의 연관 관계를 계층 구조로 정의한 인덱스 트리를 생성하고, 생성한 인덱스 트리의 구조를 기반으로 상기 문서들을 복수의 그룹으로 구분하는 인덱스 트리 생성부;상기 인덱스 트리 내의 각 노드의 위치 및 연결 관계를 기초로 상기 문서 검색 리스트 내 문서들의 표출 순서를 재정렬하는 제어부; 및상기 재정렬된 표출 순서대로 상기 문서 검색 리스트를 제공하는 출력부를 포함하며,상기 제어부는,상기 제공된 문서 검색 리스트 내에서 노이즈 문서로 분석된 제1 문서가 사용자로부터 선택되면, 상기 인덱스 트리 내에서 상기 제1 문서에 대응된 제1 하위 노드로부터 다른 그룹 내의 대표 하위 노드까지의 거리를 각각 연산하여, 상기 거리 및 상기 대표 하위 노드에 매핑된 라벨링값을 조합하여 다양성 지수를 연산하고,상기 문서들 중 상기 다양성 지수가 가장 높은 그룹에 속한 문서들이 문서 검색 리스트 상의 상위에 노출되도록, 상기 문서들의 표출 순서를 수정하며,상기 다양성 지수(Ok)는 아래 수학식에 의해 연산되는 문서 검색 장치:여기서, λ는 0과 1 사이에서 결정되는 가중치, D는 상기 제1 하위 노드와 상기 다른 그룹 내의 대표 하위 노드 사이의 노드 간 거리, R은 상기 대표 하위 노드 상에 매핑된 라벨링값을 나타낸다
|
11 |
11
청구항 10에 있어서,상기 키워드 정렬부는,임계치 이하의 빈도로 분석된 키워드를 상기 키워드 집합에서 제거하는 문서 검색 장치
|
12 |
12
청구항 10에 있어서,상기 인덱스 트리 생성부는,상기 문서 별로 구축된 상기 키워드 집합에 대한 상기 원소의 나열 순서를 기초로 뿌리 노드로부터 분기되는 트리 구조를 생성하되, 상기 키워드 집합 내 최우선 순위의 원소에 대응하여 상기 뿌리 노드에 직접 연결되는 최상위 노드를 생성한 후, 차순위의 원소에 대응하여 상기 최상위 노드에 대한 하위 노드를 차례로 생성하며,상기 생성 과정에서 상기 최우선 순위의 원소가 동종인 문서들 간에는 상기 최상위 노드를 하나의 공통 노드로 통합하여 하위 노드를 개별 분기시키고, 분기 과정에서 차순위의 원소도 동종이면 해당하는 하위 노드를 하나의 공통 노드로 통합한 후에 다음의 하위 노드를 개별 분기시키는 문서 검색 장치
|
13 |
13
청구항 12에 있어서,상기 인덱스 트리 생성부는,상기 최상위 노드 및 하위 노드 각각에 대해 대응 원소의 종류 및 라벨링값을 포함한 인덱싱 정보를 매핑하며, 상기 라벨링값은 노드의 초기 생성 시에 제1 값을 가지며 상기 통합이 발생할 때마다 제1 값 씩 증가되는 문서 검색 장치
|
14 |
14
청구항 13에 있어서,상기 인덱스 트리 생성부는,상기 최상위 노드에 각각 매핑된 라벨링값을 기초로 상기 뿌리 노드로부터 분기된 최상위 노드들의 배열 순서를 정렬하고, 하위 노드들에 각각 매핑된 라벨링값을 기초로 직전 노드에서 분기된 하위 노드들의 배열 순서를 정렬한 다음,상기 인덱스 트리 상의 하위 노드를 대상으로, 해당 하위 노드로부터 상위의 모든 노드까지의 경로에 대응하는 원소들을 상기 키워드 집합 내 소속 원소로 하는 해당 문서의 고유 넘버를 상기 해당 하위 노드에 최종 매핑하는 문서 검색 장치
|
15 |
15
청구항 14에 있어서,상기 제어부는,상기 하위 노드 각각에 매핑된 문서의 고유 넘버, 상기 최상위 노드들의 좌우 배열 순서, 그리고 문서의 고유 넘버가 매핑된 각 하위 노드의 트리 깊이를 이용하여 상기 문서들의 표출 순서를 재정렬하되,트리 좌측에 위치한 최상위 노드에 대한 하위의 노드 그룹일수록, 그리고 동일한 그룹 내에서 낮은 트리 깊이를 갖는 하위 노드일수록, 해당 노드의 문서를 상위로 정렬시키는 문서 검색 장치
|
16 |
16
삭제
|
17 |
17
삭제
|
18 |
18
청구항 10에 있어서,상기 그룹 내 대표 하위 노드는, 상기 그룹 내에서 상기 문서가 매핑된 하위 노드 중 가장 낮은 트리 깊이를 갖는 하위 노드를 나타내며,상기 제어부는,상기 표출 순서의 수정 시, 상기 제1 하위 노드가 소속된 제1 그룹의 문서를 문서 검색 리스트 상의 최하위로 이동시키는 문서 검색 장치
|