1 |
1
질의 주제 범주와 문서 주제 범주간의 변화를 분석하는 방법에 있어서,
사용자로부터 입력받은 질의에 대해 질의/문서 텍스트 정보를 토대로 해당되는 질의 주제 범주를 분류하고, 상기 입력받은 질의에 의한 정보 검색 결과로부터 상기 사용자가 선택한 문서에 대해 질의/문서 텍스트 정보를 토대로 해당되는 문서 주제 범주를 분류하는 단계;
분류한 상기 질의 주제 범주와 상기 문서 주제 범주간의 주제 범주 변화에 관한 가중치를 도출하는 단계; 및
도출한 상기 주제 범주 변화에 관한 가중치를 토대로 사용자 질의와 적합 문서간 주제 범주 변화 분석 결과로서 주제 범주 변화 지도를 생성하는 단계
를 포함하는 질의/문서 주제 범주 변화 분석 방법
|
2 |
2
제 1 항에 있어서,
생성한 상기 주제 범주 변화 지도를 토대로 사용자 질의/적합 문서에 대해 각 주제 범주별로 해당 문서들을 가상 문서로서 생성하는 단계; 및
생성한 상기 가상 문서로부터 적어도 하나의 대표 키워드를 추출해 저장하는 단계
를 더 포함하는 질의/문서 주제 범주 변화 분석 방법
|
3 |
3
제 2 항에 있어서,
상기 질의 주제 범주를 분류하는 과정 및 상기 문서 주제 범주를 분류하는 과정은,
적어도 하나의 외부 택소노미를 이용해 질의/문서 텍스트 정보를 획득하여, 계층적인 질의 주제 범주 분류를 수행하고, 계층적인 문서 주제 범주 분류를 수행하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
4 |
4
제 3 항에 있어서,
상기 외부 택소노미는,
ODP[일명 DMOZ]를 포함하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
5 |
5
제 3 항에 있어서,
상기 질의 주제 범주를 분류하는 과정 및 상기 문서 주제 범주를 분류하는 과정은,
상기 외부 택소노미에 저장되어 있는 각 주제 범주[질의 주제 범주 및 문서 주제 범주]별로 각 주제 범주들을 표현하는 특정 정보들을 이용하여 센트로이드 벡터를 생성하는 과정;
생성한 상기 센트로이드 벡터를 기준으로 하여, 상기 입력받은 질의에 대해 해당 질의 주제 범주별로 유사도를 계산하고, 상기 문서에 대해 해당 문서 주제 범주별로 유사도를 계산하는 과정; 및
계산한 상기 질의 주제 범주별 유사도 및 계산한 상기 문서 주제 범주별 유사도를 토대로, 상기 입력받은 질의에 대해 질의 주제 범주를 분류하고, 상기 문서에 대해 문서 주제 범주를 분류하는 과정
을 포함하는 질의/문서 주제 범주 변화 분석 방법
|
6 |
6
제 5 항에 있어서,
상기 센트로이드 벡터를 생성하는 과정은,
각 주제 범주에 속한 스니펫 웹문서들을 이용하여 해당 스니펫 웹문서들에 속한 단어들로 센트로이드 벡터를 생성하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
7 |
7
제 2 항에 있어서,
상기 주제 범주 변화에 관한 가중치를 도출하는 단계는,
분류한 상기 질의 주제 범주에 대한 범주명과 관련도 점수를 결정하고, 분류한 사익 문서 주제 범주에 대한 범주명과 관련도 점수를 결정하고서, 결정한 상기 관련도 점수를 토대로 질의 주제 범주와 문서 주제 범주간의 가중치를 도출하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
8 |
8
제 2 항에 있어서,
상기 주제 범주 변화 지도를 생성하는 단계는,
도출한 상기 주제 범주 변화에 관한 가중치를, 특정 질의 주제 범주에서 특정 문서 주제 범주로의 변화 확률값 또는 특정 질의에서 특정 문서 주제 범주로의 변화 확률값으로 변환하는 과정; 및
변환한 상기 특정 질의 주제 범주에서 특정 문서 주제 범주로의 변화 확률 또는 상기 특정 질의에서 특정 문서 주제 범주로의 변화 확률값을 토대로 사용자 질의와 적합 문서간 주제 범주 변화 분석 결과로서 주제 범주 변화 지도를 생성하는 과정
을 포함하는 질의/문서 주제 범주 변화 분석 방법
|
9 |
9
제 8 항에 있어서,
상기 특정 질의 주제 범주에서 특정 문서 주제 범주로의 변화 확률값은,
현재 질의 주제 범주에서 특정 문서 주제 범주로의 변화 가중치를 현재 질의 주제 범주에서 파생되는 모든 변화 가중치의 합으로 나눈 값으로 계산되는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
10 |
10
제 8 항에 있어서,
상기 특정 질의에서 특정 문서 주제 범주로의 변화 확률값은,
질의가 분류될 수 있는 소정 개수의 질의 주제 범주 각각이 특정 문서 주제 범주로 변화될 확률값을 모두 더하여 계산되는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
11 |
11
제 2 항에 있어서,
상기 가상 문서로부터 대표 키워드를 추출하는 과정은,
상기 각 주제 범주별로 수집된 문서들 중에서 대표적인 키워드들을 랭킹하는 방식을 이용하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 방법
|
12 |
12
질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 방법에 있어서,
사용자 질의와 적합 문서간 주제 범주 변화 분석 결과로서의 주제 범주 변화 지도와, 사용자 질의/적합 문서에 대해 각 주제 범주별로 해당 문서들이 가상 문서로서 생성되어 있되,
사용자로부터 질의를 입력받으면 상기 입력 질의에 대해 질의/문서 텍스트 정보를 토대로 해당되는 질의 주제 범주를 분류하는 단계;
상기 주제 범주 변화 지도를 토대로 상기 분류한 질의 주제 범주에 대한 적합 문서 주제 범주를 할당하는 단계;
상기 가상 문서를 토대로, 할당한 상기 질의 주제 범주와 상기 적합 문서 주제 범주에 대해 대표적인 키워드들을 랭킹하는 단계;
랭킹한 상기 대표적인 키워드들을 이용해 상기 입력 질의를 확장하는 단계; 및
확장한 상기 입력 질의로 해당되는 문서들을 검색하는 단계
를 포함하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 방법
|
13 |
13
제 12 항에 있어서,
상기 검색한 문서들을 상기 대표적인 키워드들 랭킹 순서에 따라 사용자에게 제공하는 단계
를 더 포함하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 방법
|
14 |
14
제 12 항에 있어서,
상기 대표적인 키워드들을 랭킹하는 단계는,
상기 할당한 질의 주제 범주에 대해 적합도가 있는 적어도 하나의 문서 주제 범주를 포함시켜 랭킹 순서에 따른 대표 키워드 리스트를 생성하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 방법
|
15 |
15
제 12 항에 있어서,
상기 입력 질의를 확장하는 단계는,
상기 입력 질의와 상기 랭킹한 대표적인 키워드들을 단순 병합 또는 합성 가중치를 토대로 합성하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 방법
|
16 |
16
제 1 항 내지 제 15 항 중 어느 한 항의 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|
17 |
17
질의 주제 범주와 문서 주제 범주간의 변화를 분석하는 시스템에 있어서,
질의/문서 텍스트 정보가 저장되어 있는 적합도 판단 문서 컬렉션 DB;
상기 질의/문서 텍스트 정보를 토대로 사용자 질의에 대해 질의 주제 범주를 분류하고, 상기 질의/문서 텍스트 정보를 토대로 상기 사용자 질의에 의한 정보 검색 결과로부터 선택된 문서에 대해 문서 주제 범주를 분류하기 위한 주제 범주 분류기; 및
상기 주제 범주 분류기에서 분류한 질의 주제 범주 및 문서 주제 범주간의 주제 범주 변화에 관한 가중치를 토대로 생성되는 사용자 질의와 적합 문서간 주제 범주 변화 지도가 저장되는 주제 범주 변화 지도 DB
를 포함하는 질의/문서 주제 범주 변화 분석 시스템
|
18 |
18
제 17 항에 있어서,
상기 주제 범주 변화 지도 DB의 주제 범주 변화 지도를 토대로 사용자 질의/적합 문서에 대해 각 주제 범주별로 해당 문서들이 생성되어 가상 문서로서 저장되고, 상기 가상 문서로부터 추출된 적어도 하나의 대표 키워드가 저장되는 주제 범주별 가상 문서 집합 DB
를 더 포함하는 질의/문서 주제 범주 변화 분석 시스템
|
19 |
19
제 17 항 또는 제 18 항에 있어서,
상기 주제 범주 분류기는,
적어도 하나의 외부 택소노미를 포함하는 택소노미 DB;
상기 외부 택소노미에 저장되어 있는 각 주제 범주[질의 주제 범주 및 문서 주제 범주]별로 각 주제 범주들을 표현하는 특정 정보들을 이용하여 센트로이드 벡터를 생성하는 주제 범주별 센트로이드 생성기; 및
상기 주제 범주별 센트로이드 생성기에서 생성한 센트로이드 벡터를 기준으로 하여, 입력 질의에 대해 해당 질의 주제 범주별로 유사도를 계산하고, 상기 문서에 대해 해당 문서 주제 범주별로 유사도를 계산하는 주제 범주별 유사도 계산기
를 포함하는 질의/문서 주제 범주 변화 분석 시스템
|
20 |
20
제 17 항 또는 제 18 항에 있어서,
상기 질의/문서 텍스트 정보는,
일련의 질의 모음과, 뉴스 문서의 모음, 질의와 관련된/관련되지 않은 문서간의 매핑 정보를 포함하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석 시스템
|
21 |
21
질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 시스템에 있어서,
사용자 질의와 적합 문서간 주제 범주 변화 분석 결과로서의 주제 범주 변화 지도와, 사용자 질의/적합 문서에 대해 각 주제 범주별로 해당 문서들이 가상 문서로서 생성되어 질의/문서 주제 범주 변화 분석 시스템에 저장되어 있되,
사용자 질의에 대해 질의 주제 범주를 분류하고, 상기 주제 범주 변화 지도를 토대로 상기 분류한 질의 주제 범주에 대한 적합 문서 주제 범주를 할당하고, 상기 가상 문서를 토대로, 할당한 상기 질의 주제 범주와 상기 적합 문서 주제 범주에 대해 대표적인 키워드들을 랭킹하고, 랭킹한 상기 대표적인 키워드들을 이용해 상기 사용자 질의를 확장하기 위한 질의 확장기; 및
상기 질의 확장기에서 확장한 사용자 질의로 해당되는 문서들을 검색하기 위한 검색 엔진
을 포함하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 시스템
|
22 |
22
제 21 항에 있어서,
상기 검색 엔진은,
상기 검색한 문서들을 상기 대표적인 키워드들 랭킹 순서에 따라 사용자에게 제공하는 것을 특징으로 하는 질의/문서 주제 범주 변화 분석을 이용한 질의 확장 기반 정보 검색 시스템
|