1 |
1
통신망을 통해 통신을 수행하기 위한 통신 인터페이스부;
기 저장된 학술정보와 신규로 등록되는 학술정보를 기 설정된 기준에 따라 가공 처리하여 언어정보 자원을 생성하고, 이를 데이터베이스에 저장하는 언어자원 자동 생성부;
언어자원 자동 생성부에 의해서 생성된 언어정보 자원에 대해 필터링하고, 가중치를 부여하여 학술정보의 색인 및 자동 분류를 수행하는 의미 색인 및 해석부;
복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 데이터베이스에 저장하고, 웹 정보 자원에 대해 가중치 부여, 자동의미색인 및 자동 분류를 수행하여 웹 정보 자원을 구축하는 웹 정보 자원 수집 및 해석부;
학술정보와 웹 정보 간의 유사도를 측정하여 관련 문헌을 자동 연계 처리하는 유사 문헌 연계 처리부; 및
의미 기반 자동 연계 시스템과 관련된 정보를 저장하는 데이터베이스;
를 포함하는 의미 기반 자동 연계 시스템
|
2 |
2
제1항에 있어서,
언어자원 자동 생성부는,
학술정보의 키워드 필드로부터 주요 색인어를 추출하여 데이터베이스에 저장하는 주요 언어자원 구축수단;
주요 색인어의 주제 분야별 가중치 벡터를 생성하여 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하고 데이터베이스에 저장하는 가중치 벡터 구축수단; 및
학술정보 내에서 주요 색인어가 동시에 발생하는 공기정보(Co-Occurrence Information)를 측정하여 색인어 연관성 정보를 생성하고 데이터베이스에 저장하는 연관 정보 구축수단;
를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
3 |
3
제2항에 있어서,
상기 주제 가중치 벡터는, 각각의 색인어에 대한 주제 코드와 가중치 값으로 구성된 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
4 |
4
제2항에 있어서,
상기 주요 언어자원 구축수단은,
신규 자원이 등록되어 학술정보자원이 갱신되면, 관련 언어자원을 자동으로 갱신하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
5 |
5
제2항에 있어서,
상기 가중치 벡터 구축수단은,
신규 자원이 등록되어 학술정보자원이 갱신되면, 해당 학술자원에 대한 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하여 기존의 정보를 갱신하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
6 |
6
제1항 또는 제2항에 있어서,
상기 의미 색인 및 해석부는,
주요 색인어의 주제 분야별 가중치에 따라 동적으로 색인어 DB의 규모를 조절하는 색인어 선정수단; 및
상기 색인어 선정수단에 의해서 선정된 해당 학술정보의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 의미 색인수단;
를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
7 |
7
제6항에 있어서,
상기 의미 색인수단은, 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
8 |
8
제6항에 있어서,
상기 의미 색인 및 해석부는,
학술정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 학술정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 의미 가중치 부여수단;
을 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
9 |
9
제2항에 있어서,
상기 웹 정보 자원 수집 및 해석부는,
복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 데이터베이스에 저장하는 웹 정보 자원 구축수단;
주요 HTML 태그에서 추출된 색인어의 주제 가중치 벡터에 가중치 값을 추가로 부여하는 가중치 부여수단;
웹 정보 자원의 주제 분야별 가중치에 따라 동적으로 색인어 DB의 규모를 조절하는 색인어 선정수단; 및
상기 색인어 선정수단에 의해서 선정된 색인어 DB를 이용하여 해당 웹 정보 자원의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 의미 색인수단;
을 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
10 |
10
제9항에 있어서,
상기 웹 정보 자원 수집 및 해석부는,
웹 정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 상기 연관정보 구축수단에 의해서 기 생성된 색인어 연관성 정보를 이용하여, 웹 정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 연관정보 가중치 부여수단;
을 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
11 |
11
제9항에 있어서,
상기 의미 색인수단은,
이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
12 |
12
제9항에 있어서,
상기 웹 정보 자원 구축수단은,
웹 정보 자원의 HTML(Hyper Text Markup Language) 태그를 식별하여, 본문 내용 만을 남기도록 하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
13 |
13
제1항에 있어서,
유사 문헌 연계 처리부는,
학술정보와 웹 정보 각각에 생성된 색인어, 색인어 출현빈도, 주제코드, 주제분야별 가중치 값 또는 이들의 조합 중 어느 하나를 이용하여 유사도를 측정하고, 측정된 유사도에 따라 순위를 설정하여 결과값을 데이터베이스에 저장하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
14 |
14
제13항에 있어서,
상기 유사 문헌 연계 처리부는,
학술정보와 웹 정보 각각의 주요 색인어 추출 과정에서 생성된 색인어와 색인어 출현빈도를 이용하여 유사도를 측정하고 측정된 유사도에 따라 순위를 설정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
15 |
15
제13항에 있어서,
상기 유사 문헌 연계 처리부는,
학술정보와 웹 정보 간 색인어와 색인어 출현빈도를 유사 계수(Similarity Measures) 또는 거리 계수(Distance Measures)에 적용하여 유사도를 측정하고 측정된 유사도에 따라 순위를 설정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
16 |
16
제13항에 있어서,
상기 유사 문헌 연계 처리부는,
학술정보와 웹 정보 양측의 자동분류 결과를 이용해 후보 클러스터를 사전 정의하여 비교대상 규모를 축소한 후, 축소된 정보를 기초로 학술정보와 웹 정보 간의 유사도를 측정하고 측정된 유사도에 따라 순위를 결정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
17 |
17
제1항에 있어서,
상기 의미 기반 자동 연계 시스템은,
사용자에 의해서 특정 키워드가 입력되면, 해당 학술정보를 추출하여 제공하고, 상기 학술정보에 대한 상세 정보 열람이 요청되는 경우, 데이터베이스로부터 상기 학술정보와 연계된 웹 정보를 추출하여 유사도 순서로 제공하는 정보 검색 및 결과 제공부;
를 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
18 |
18
제17항에 있어서,
상기 정보 검색 및 결과 제공부는,
사용자에 의해서 특정 웹 정보가 선택되는 경우, 상기 특정 웹 정보를 제공하는 해당 사이트로 이동할 수 있도록 서비스를 제공하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
|
19 |
19
의미 기반 자동 연계 시스템에서 학술정보와 웹 정보를 의미 기반으로 자동 연계하는 방법으로서,
a) 의미 기반 자동 연계 시스템이 기 저장된 학술정보와 신규로 등록되는 학술정보를 기 설정된 기준에 따라 가공 처리 및 저장하여 언어정보 자원을 생성하는 단계;
b) 상기 a) 단계에서 생성된 언어정보 자원에 대해 필터링하고, 가중치를 부여하여 학술정보의 색인 및 자동 분류를 수행하는 단계;
c) 복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 저장하는 단계;
d) 상기 c) 단계에서 수집된 웹 정보 자원에 대해 가중치 부여, 자동의미색인 및 자동 분류를 수행하여 웹 정보 자원을 구축하는 단계;
e) 학술정보와 웹 정보 간의 유사도를 측정하여 관련 문헌을 자동 연계 처리하는 단계; 및
f) 사용자에 의해서 특정 키워드가 입력되면, 해당 학술정보를 추출하여 제공하고, 상기 학술정보에 대한 상세 정보 열람이 요청되는 경우, 기 저장된 정보로부터 상기 학술정보와 연계된 웹 정보를 추출하여 유사도 순서로 제공하는 단계;
를 포함하는 의미 기반 자동 연계 방법
|
20 |
20
제19항에 있어서,
상기 a) 단계는,
학술정보의 키워드 필드로부터 주요 색인어를 추출하여 저장하는 단계;
주요 색인어의 주제 분야별 가중치 벡터를 생성하여 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하여 저장하는 단계; 및
학술정보 내에서 주요 색인어가 동시에 발생하는 공기정보(Co-Occurrence Information)를 측정하여 색인어 연관성 정보를 생성하여 저장하는 단계;
를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
|
21 |
21
제20항에 있어서,
상기 b) 단계는,
b-1) 주요 색인어의 주제 분야별 가중치에 따라 색인어 DB의 규모를 조절하는 단계;
b-2) 상기 b-1) 단계에서 선정된 해당 학술정보의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 단계; 및
b-3) 학술정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 학술정보 색인어의 연관 정도에 따라 의미 가중치를 부여하는 단계;
를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
|
22 |
22
제21항에 있어서,
상기 b-2) 단계 이후에,
상기 b-2) 단계에서 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 방법
|
23 |
23
제20항에 있어서,
상기 d) 단계는,
d-1) 웹 정보 자원의 주요 HTML 태그에서 추출된 색인어의 주제 가중치 벡터에 대해 가중치 값을 추가로 부여하는 단계;
d-2) 주요 색인어의 주제 분야별 가중치에 따라 색인어 DB의 규모를 조절하는 단계;
d-3) 상기 d-2) 단계에서 선정된 색인어 DB를 이용하여 해당 웹 정보 자원의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 단계; 및
d-4) 웹 정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 웹 정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 단계;
를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
|
24 |
24
제23항에 있어서,
상기 d-3) 단계 이후에,
상기 d-3) 단계에서 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 방법
|