맞춤기술찾기

이전대상기술

의미 기반 자동 연계 시스템 및 방법

  • 기술번호 : KST2016001152
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 학술정보를 기준 도메인 영역으로 정의하고, 기준 도메인 영역으로부터 자동 생성된 색인어를 바탕으로 외부 도메인 영역의 웹 정보를 학술정보와 연계하여 이기종 도메인 간의 자원들을 의미 유사도에 따라 자동 매핑하기 위한 의미 기반 자동 연계 시스템 및 방법에 관한 것으로서, 기 저장된 학술정보와 신규로 등록되는 학술정보를 기 설정된 기준에 따라 가공 처리하여 언어정보 자원을 생성하고, 이를 데이터베이스에 저장하는 언어자원 자동 생성부; 언어자원 자동 생성부에 의해서 생성된 언어정보 자원에 대해 필터링하고, 가중치를 부여하여 학술정보의 색인 및 자동 분류를 수행하는 의미 색인 및 해석부; 복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 데이터베이스에 저장하고, 웹 정보 자원에 대해 가중치 부여, 자동의미색인 및 자동 분류를 수행하여 웹 정보 자원을 구축하는 웹 정보 자원 수집 및 해석부; 학술정보와 웹 정보 간의 유사도를 측정하여 관련 문헌을 자동 연계 처리하는 유사 문헌 연계 처리부;를 포함하여, 학술정보 이용자가 학술연구 정보 서비스 플랫폼의 정보 검색 결과에서 학술정보와 관련된 웹 정보를 제공받을 수 있으며, 운용자 측에서는 이를 활용한 다양한 서비스를 확대 제공할 수 있다는 효과를 기대할 수 있다.
Int. CL G06F 17/30 (2006.01)
CPC G06F 17/30616(2013.01) G06F 17/30616(2013.01) G06F 17/30616(2013.01) G06F 17/30616(2013.01) G06F 17/30616(2013.01) G06F 17/30616(2013.01)
출원번호/일자 1020080115039 (2008.11.19)
출원인 한국과학기술정보연구원
등록번호/일자 10-0992887-0000 (2010.11.02)
공개번호/일자 10-2010-0056065 (2010.05.27) 문서열기
공고번호/일자 (20101108) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.11.19)
심사청구항수 24

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정도헌 대한민국 서울특별시 중구
2 김환민 대한민국 서울특별시 노원구
3 김혜선 대한민국 서울특별시 강동구
4 신기정 대한민국 서울특별시 도봉구
5 최희윤 대한민국 서울특별시 송파구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인(유)화우 대한민국 서울특별시 강남구 테헤란로***길 **, *층 (대치동, 삼호빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.11.19 수리 (Accepted) 1-1-2008-0796725-64
2 선행기술조사의뢰서
Request for Prior Art Search
2009.05.08 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2009.06.15 수리 (Accepted) 9-1-2009-0036741-68
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.12.23 수리 (Accepted) 4-1-2009-5253238-15
5 등록결정서
Decision to grant
2010.10.25 발송처리완료 (Completion of Transmission) 9-5-2010-0476575-90
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
통신망을 통해 통신을 수행하기 위한 통신 인터페이스부; 기 저장된 학술정보와 신규로 등록되는 학술정보를 기 설정된 기준에 따라 가공 처리하여 언어정보 자원을 생성하고, 이를 데이터베이스에 저장하는 언어자원 자동 생성부; 언어자원 자동 생성부에 의해서 생성된 언어정보 자원에 대해 필터링하고, 가중치를 부여하여 학술정보의 색인 및 자동 분류를 수행하는 의미 색인 및 해석부; 복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 데이터베이스에 저장하고, 웹 정보 자원에 대해 가중치 부여, 자동의미색인 및 자동 분류를 수행하여 웹 정보 자원을 구축하는 웹 정보 자원 수집 및 해석부; 학술정보와 웹 정보 간의 유사도를 측정하여 관련 문헌을 자동 연계 처리하는 유사 문헌 연계 처리부; 및 의미 기반 자동 연계 시스템과 관련된 정보를 저장하는 데이터베이스; 를 포함하는 의미 기반 자동 연계 시스템
2 2
제1항에 있어서, 언어자원 자동 생성부는, 학술정보의 키워드 필드로부터 주요 색인어를 추출하여 데이터베이스에 저장하는 주요 언어자원 구축수단; 주요 색인어의 주제 분야별 가중치 벡터를 생성하여 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하고 데이터베이스에 저장하는 가중치 벡터 구축수단; 및 학술정보 내에서 주요 색인어가 동시에 발생하는 공기정보(Co-Occurrence Information)를 측정하여 색인어 연관성 정보를 생성하고 데이터베이스에 저장하는 연관 정보 구축수단; 를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
3 3
제2항에 있어서, 상기 주제 가중치 벡터는, 각각의 색인어에 대한 주제 코드와 가중치 값으로 구성된 것을 특징으로 하는 의미 기반 자동 연계 시스템
4 4
제2항에 있어서, 상기 주요 언어자원 구축수단은, 신규 자원이 등록되어 학술정보자원이 갱신되면, 관련 언어자원을 자동으로 갱신하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
5 5
제2항에 있어서, 상기 가중치 벡터 구축수단은, 신규 자원이 등록되어 학술정보자원이 갱신되면, 해당 학술자원에 대한 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하여 기존의 정보를 갱신하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
6 6
제1항 또는 제2항에 있어서, 상기 의미 색인 및 해석부는, 주요 색인어의 주제 분야별 가중치에 따라 동적으로 색인어 DB의 규모를 조절하는 색인어 선정수단; 및 상기 색인어 선정수단에 의해서 선정된 해당 학술정보의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 의미 색인수단; 를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
7 7
제6항에 있어서, 상기 의미 색인수단은, 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 시스템
8 8
제6항에 있어서, 상기 의미 색인 및 해석부는, 학술정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 학술정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 의미 가중치 부여수단; 을 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
9 9
제2항에 있어서, 상기 웹 정보 자원 수집 및 해석부는, 복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 데이터베이스에 저장하는 웹 정보 자원 구축수단; 주요 HTML 태그에서 추출된 색인어의 주제 가중치 벡터에 가중치 값을 추가로 부여하는 가중치 부여수단; 웹 정보 자원의 주제 분야별 가중치에 따라 동적으로 색인어 DB의 규모를 조절하는 색인어 선정수단; 및 상기 색인어 선정수단에 의해서 선정된 색인어 DB를 이용하여 해당 웹 정보 자원의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 의미 색인수단; 을 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
10 10
제9항에 있어서, 상기 웹 정보 자원 수집 및 해석부는, 웹 정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 상기 연관정보 구축수단에 의해서 기 생성된 색인어 연관성 정보를 이용하여, 웹 정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 연관정보 가중치 부여수단; 을 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
11 11
제9항에 있어서, 상기 의미 색인수단은, 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 시스템
12 12
제9항에 있어서, 상기 웹 정보 자원 구축수단은, 웹 정보 자원의 HTML(Hyper Text Markup Language) 태그를 식별하여, 본문 내용 만을 남기도록 하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
13 13
제1항에 있어서, 유사 문헌 연계 처리부는, 학술정보와 웹 정보 각각에 생성된 색인어, 색인어 출현빈도, 주제코드, 주제분야별 가중치 값 또는 이들의 조합 중 어느 하나를 이용하여 유사도를 측정하고, 측정된 유사도에 따라 순위를 설정하여 결과값을 데이터베이스에 저장하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
14 14
제13항에 있어서, 상기 유사 문헌 연계 처리부는, 학술정보와 웹 정보 각각의 주요 색인어 추출 과정에서 생성된 색인어와 색인어 출현빈도를 이용하여 유사도를 측정하고 측정된 유사도에 따라 순위를 설정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
15 15
제13항에 있어서, 상기 유사 문헌 연계 처리부는, 학술정보와 웹 정보 간 색인어와 색인어 출현빈도를 유사 계수(Similarity Measures) 또는 거리 계수(Distance Measures)에 적용하여 유사도를 측정하고 측정된 유사도에 따라 순위를 설정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
16 16
제13항에 있어서, 상기 유사 문헌 연계 처리부는, 학술정보와 웹 정보 양측의 자동분류 결과를 이용해 후보 클러스터를 사전 정의하여 비교대상 규모를 축소한 후, 축소된 정보를 기초로 학술정보와 웹 정보 간의 유사도를 측정하고 측정된 유사도에 따라 순위를 결정하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
17 17
제1항에 있어서, 상기 의미 기반 자동 연계 시스템은, 사용자에 의해서 특정 키워드가 입력되면, 해당 학술정보를 추출하여 제공하고, 상기 학술정보에 대한 상세 정보 열람이 요청되는 경우, 데이터베이스로부터 상기 학술정보와 연계된 웹 정보를 추출하여 유사도 순서로 제공하는 정보 검색 및 결과 제공부; 를 더 포함하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
18 18
제17항에 있어서, 상기 정보 검색 및 결과 제공부는, 사용자에 의해서 특정 웹 정보가 선택되는 경우, 상기 특정 웹 정보를 제공하는 해당 사이트로 이동할 수 있도록 서비스를 제공하는 것을 특징으로 하는 의미 기반 자동 연계 시스템
19 19
의미 기반 자동 연계 시스템에서 학술정보와 웹 정보를 의미 기반으로 자동 연계하는 방법으로서, a) 의미 기반 자동 연계 시스템이 기 저장된 학술정보와 신규로 등록되는 학술정보를 기 설정된 기준에 따라 가공 처리 및 저장하여 언어정보 자원을 생성하는 단계; b) 상기 a) 단계에서 생성된 언어정보 자원에 대해 필터링하고, 가중치를 부여하여 학술정보의 색인 및 자동 분류를 수행하는 단계; c) 복수의 웹 서비스 서버로부터 수집된 웹 정보 자원에 대해 HTML 태그를 파싱하고 구분하여 저장하는 단계; d) 상기 c) 단계에서 수집된 웹 정보 자원에 대해 가중치 부여, 자동의미색인 및 자동 분류를 수행하여 웹 정보 자원을 구축하는 단계; e) 학술정보와 웹 정보 간의 유사도를 측정하여 관련 문헌을 자동 연계 처리하는 단계; 및 f) 사용자에 의해서 특정 키워드가 입력되면, 해당 학술정보를 추출하여 제공하고, 상기 학술정보에 대한 상세 정보 열람이 요청되는 경우, 기 저장된 정보로부터 상기 학술정보와 연계된 웹 정보를 추출하여 유사도 순서로 제공하는 단계; 를 포함하는 의미 기반 자동 연계 방법
20 20
제19항에 있어서, 상기 a) 단계는, 학술정보의 키워드 필드로부터 주요 색인어를 추출하여 저장하는 단계; 주요 색인어의 주제 분야별 가중치 벡터를 생성하여 색인어와 주제 가중치 벡터의 연계 정보(색인어-주제 가중치 벡터)를 생성하여 저장하는 단계; 및 학술정보 내에서 주요 색인어가 동시에 발생하는 공기정보(Co-Occurrence Information)를 측정하여 색인어 연관성 정보를 생성하여 저장하는 단계; 를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
21 21
제20항에 있어서, 상기 b) 단계는, b-1) 주요 색인어의 주제 분야별 가중치에 따라 색인어 DB의 규모를 조절하는 단계; b-2) 상기 b-1) 단계에서 선정된 해당 학술정보의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 단계; 및 b-3) 학술정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 학술정보 색인어의 연관 정도에 따라 의미 가중치를 부여하는 단계; 를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
22 22
제21항에 있어서, 상기 b-2) 단계 이후에, 상기 b-2) 단계에서 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 방법
23 23
제20항에 있어서, 상기 d) 단계는, d-1) 웹 정보 자원의 주요 HTML 태그에서 추출된 색인어의 주제 가중치 벡터에 대해 가중치 값을 추가로 부여하는 단계; d-2) 주요 색인어의 주제 분야별 가중치에 따라 색인어 DB의 규모를 조절하는 단계; d-3) 상기 d-2) 단계에서 선정된 색인어 DB를 이용하여 해당 웹 정보 자원의 초록 또는 원문 데이터에서 단일어절이나 2개 이상의 어절로 구성된 복합명사를 색인하고, 어절 수와 색인어 길이에 따라 가중치를 부여하는 단계; 및 d-4) 웹 정보 내에서 주요 색인어가 동시에 발생하는 것을 의미하는 기 생성된 색인어 연관성 정보를 이용하여, 웹 정보 색인어의 연관 정도에 따라 의미 가중치를 추가 부여하는 단계; 를 포함하는 것을 특징으로 하는 의미 기반 자동 연계 방법
24 24
제23항에 있어서, 상기 d-3) 단계 이후에, 상기 d-3) 단계에서 이미 색인된 복합명사를 다시 단일어절 단위로 재색인 하지 않는 것을 특징으로 하는 의미 기반 자동 연계 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.