1 |
1
분야분류체계 및 시소러스를 연동하는 정보검색 시스템에서,문서를 읽어 들이는 단계;상기 문서의 내용이 추출되는 단계;추출된 상기 문서의 형태소 분석이 실시되어, 상기 문서의 색인어가 추출되는 단계;상기 시소러스를 통하여 상기 색인어가 시소러스 매칭 되어 분석되는 단계; 및상기 분석 결과를 문서 DB에 저장하는 단계를 포함하는 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 형성 방법
|
2 |
2
제1항에 있어서,상기 시소러스 매칭은 상기 색인어의 용어 빈도, 문서 빈도, 분야분류코드 빈도 및 개념어 깊이로 이루어진 군에서 선택된 하나 이상의 조건을 비교하여 분석되는 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 형성 방법
|
3 |
3
제1항 또는 제2항에 있어서,상기 분석 결과는 상기 문서에 대하여 상기 조건에 따라 항목에 대한 확률 값을 순서대로 할당한 정보인 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 형성 방법
|
4 |
4
제3항에 있어서,상기 항목은 분야분류코드 또는 주제인 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 형성 방법
|
5 |
5
제3항에 있어서,상기 항목에 대하여 상기 확률 값이 큰 순서에 따라 선택된 분야분류코드 또는 주제의 상기 확률 값이 저장되는 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 형성 방법
|
6 |
6
분야분류체계 및 시소러스를 연동하는 정보검색 시스템에서,문서에서 새로운 분야 또는 새로운 용어가 추출되는 단계;상기 새로운 분야 또는 상기 새로운 용어에 대하여 분야분류체계를 경신하는 단계;경신된 상기 분야분류체계 또는 상기 새로운 용어에 의해서 상기 시소러스를 경신하는 단계; 경신된 상기 시소러스를 적용하여 저장된 문서의 색인어가 시소러스 매칭 되어 분석되는 단계; 및상기 분석 결과를 문서 DB에 저장하는 단계를 포함하는 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 관리 방법
|
7 |
7
제6항에 있어서,상기 시소러스 매칭은 상기 색인어의 용어 빈도, 문서 빈도, 분야분류코드 빈도 및 개념어 깊이로 이루어진 군에서 선택된 하나 이상의 조건을 비교하여 분석되는 것을 특징으로 하는 시소러스 매칭에 의한 문서 DB 관리 방법
|
8 |
8
분야분류체계 및 시소러스를 연동하는 정보검색 시스템에서,질의어를 읽어 들이는 단계;상기 질의어의 형태소 분석이 실시되어 상기 질의어의 색인어가 추출되는 단계;상기 색인어를 시소러스 매칭에 의해서 형성된 문서 DB와 비교하여 검색하는 단계; 및상기 검색 결과를 제공하는 단계를 포함하는 것을 특징으로 하는 정보검색 방법
|
9 |
9
제8항에 있어서,상기 검색 결과는 분야분류코드 또는 주제와 함께 제공되는 것을 특징으로 하는 정보검색 방법
|
10 |
10
분야분류체계 및 시소러스를 연동하는 정보검색 시스템에서,문서를 읽어 들이는 단계;상기 문서의 내용이 추출되는 단계;추출된 상기 문서의 형태소 분석이 실시되어, 상기 문서의 색인어가 추출되는 단계;상기 시소러스를 통하여 상기 색인어가 시소러스 매칭 되는 분야분류코드 또는 주제를 상기 문서에 부여하는 단계; 상기 분야분류코드 또는 상기 주제를 문서 DB와 비교하여 검색하는 단계; 및상기 검색 결과를 제공하는 단계를 포함하는 것을 특징으로 하는 정보검색 방법
|
11 |
11
제10항에 있어서,상기 문서와 상기 문서 DB를 분야분류코드, 확률 값, 색인어 분포, 색인어 빈도 및 저자의 이름으로 이루이진 군에서 선택된 하나 이상의 조건에 대하여 유사성을 비교하거나 중복검사를 하는 것을 특징으로 하는 정보검색 방법
|
12 |
12
제11항에 있어서,상기 검색 결과는 상기 유사성을 군집화(clustering)하여 문서로 제공하는 것을 특징으로 하는 정보검색 방법
|