맞춤기술찾기

이전대상기술

비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템및 그 방법

  • 기술번호 : KST2015182737
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 1. 청구범위에 기재된 발명이 속한 기술분야본 발명은 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.2. 발명이 해결하려고 하는 기술적 과제본 발명은 유비쿼터스(Ubiquitous) 환경에서 도메인별로 구분된 비정형 데이터를 포함한 비구조 웹문서로부터 정보 추출 규칙을 학습하며, 이를 이용하여 임의의 도메인 웹문서에서 주요 정보(사용자가 원하는 정형화된 정보)를 자동으로 추출하기 위한 도메인별 정보 추출 장치 및 그 방법과, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.3. 발명의 해결방법의 요지본 발명은, 도메인별로 구분된 비정형 데이터를 포함한 비구조 웹문서들의 각 특성 및 도메인별 온톨로지를 이용하여 의미 모호성이 배제된 주요 정보(도메인에서 대표적 성격을 갖는 어휘)의 추출 규칙을 생성하기 위한 학습수단; 학습된 상기 추출 규칙을 저장하고 있는 규칙저장수단; 및 정보 추출 대상 도메인의 문서 입력시, 상기 문서에서 분석 대상이 되는 내용을 추출하여 언어적 의미를 갖는 단위(어휘)로 분리하고 이중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체한 후, 의미있는 어휘들을 상기 추출 규칙에서 찾아내어 자동으로 주요 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하기 위한 정보추출수단을 포함한다.4. 발명의 중요한 용도본 발명은 유비쿼터스(Ubiquitous) 환경 및 차세대 웹 환경 등에 이용됨.유비쿼터스, 도메인 문서, 온톨로지, 학습 규칙, 베이시안 네트워크
Int. CL G06Q 50/10 (2012.01.01)
CPC G06Q 50/10(2013.01)
출원번호/일자 1020050063896 (2005.07.14)
출원인 주식회사 케이티, 서치캐스트 주식회사, 한국산업기술평가관리원, 주식회사 솔트룩스, 중앙대학교 산학협력단
등록번호/일자
공개번호/일자 10-2007-0008994 (2007.01.18) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 주식회사 케이티 대한민국 경기도 성남시 분당구
2 서치캐스트 주식회사 대한민국 서울특별시 서초구
3 한국산업기술평가관리원 대한민국 대구광역시 동구
4 중앙대학교 산학협력단 대한민국 서울특별시 동작구
5 주식회사 솔트룩스 대한민국 서울특별시 강남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 안태성 대한민국 서울 종로구
2 이반 배를로셰 프랑스 서울 종로구
3 정용일 대한민국 서울 종로구
4 전호현 대한민국 서울 서초구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 신성특허법인(유한) 대한민국 서울특별시 송파구 중대로 ***, ID타워 ***호 (가락동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2005.07.14 수리 (Accepted) 1-1-2005-0382265-16
2 서지사항보정서
Amendment to Bibliographic items
2005.07.15 수리 (Accepted) 1-1-2005-0383042-10
3 전자문서첨부서류제출서
Submission of Attachment to Electronic Document
2005.07.18 수리 (Accepted) 1-1-2005-5089387-65
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2005.11.04 수리 (Accepted) 4-1-2005-5115322-12
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2005.12.24 수리 (Accepted) 4-1-2005-0039354-62
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2006.06.08 수리 (Accepted) 4-1-2006-5080042-57
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2007.07.11 수리 (Accepted) 4-1-2007-5109884-21
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2008.09.02 수리 (Accepted) 4-1-2008-5140932-32
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.03.13 수리 (Accepted) 4-1-2009-5047686-24
10 [출원인변경]권리관계변경신고서
[Change of Applicant] Report on Change of Proprietary Status
2009.08.24 수리 (Accepted) 1-1-2009-0517366-90
11 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2009.09.04 수리 (Accepted) 1-1-2009-0546030-34
12 [대리인사임]대리인(대표자)에 관한 신고서
[Resignation of Agent] Report on Agent (Representative)
2009.09.07 수리 (Accepted) 1-1-2009-0548881-18
13 [출원인변경]권리관계변경신고서
[Change of Applicant] Report on Change of Proprietary Status
2009.10.12 수리 (Accepted) 1-1-2009-0623431-79
14 [대리인사임]대리인(대표자)에 관한 신고서
[Resignation of Agent] Report on Agent (Representative)
2009.11.13 수리 (Accepted) 1-1-2009-0697569-27
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.04.02 수리 (Accepted) 4-1-2010-0006517-18
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.04.19 수리 (Accepted) 4-1-2010-5068437-23
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.07.20 수리 (Accepted) 4-1-2011-5148883-62
18 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.07.20 수리 (Accepted) 4-1-2011-5148879-89
19 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.01.10 수리 (Accepted) 4-1-2012-5005621-98
20 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.03.21 수리 (Accepted) 4-1-2012-5058926-38
21 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.06.08 수리 (Accepted) 4-1-2012-5122434-12
22 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.02.15 수리 (Accepted) 4-1-2013-0003076-63
23 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.07.31 수리 (Accepted) 4-1-2013-5106568-91
24 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.03 수리 (Accepted) 4-1-2014-0000494-54
25 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018159-78
26 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.08.19 수리 (Accepted) 4-1-2014-5098935-45
27 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.10.20 수리 (Accepted) 4-1-2014-5123944-33
28 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.01.16 수리 (Accepted) 4-1-2015-5006674-89
29 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.01.21 수리 (Accepted) 4-1-2015-5009201-22
30 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.07.04 수리 (Accepted) 4-1-2018-5125629-51
31 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.07.29 수리 (Accepted) 4-1-2019-5151122-15
32 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.01 수리 (Accepted) 4-1-2019-5153932-16
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
정보 추출 시스템에 있어서, 도메인별로 구분된 비정형 데이터를 포함한 비구조 웹문서들의 각 특성 및 도메인별 온톨로지를 이용하여 의미 모호성이 배제된 주요 정보(도메인에서 대표적 성격을 갖는 어휘)의 추출 규칙을 생성하기 위한 학습수단; 학습된 상기 추출 규칙을 저장하고 있는 규칙저장수단; 및 정보 추출 대상 도메인의 문서 입력시, 상기 문서에서 분석 대상이 되는 내용을 추출하여 언어적 의미를 갖는 단위(어휘)로 분리하고 이중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체한 후, 의미있는 어휘들을 상기 추출 규칙에서 찾아내어 자동으로 주요 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하기 위한 정보추출수단을 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
2 2
제 1 항에 있어서, 상기 추출된 정보(도메인에서 대표적 성격을 갖는 어휘)를 출력하여, 확인받음에 따라 최종 정보로 확정하기 위한 정보출력수단을 더 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
3 3
제 1 항에 있어서, 상기 학습수단은, 도메인별 문서에서 분석 대상이 되는 내용을 추출하기 위한 제1 문서 분석부; 상기 제1 문서 분석부를 통해 분석된 결과를 언어사전을 이용하여 언어적 의미를 갖는 단위로 분리하기 위한 제2 언어 분석부; 도메인 온톨로지를 이용하여, 상기 언어적 의미를 갖는 단위(어휘)들 중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체하기 위한 제1 온톨로지 매칭부; 의미적 모호성이 있는 어휘가 대표 어휘로 교체된 상기 언어적 의미를 갖는 어휘들에서 공지의 통계적 정보 추출 방식을 통해 우선순위를 갖는 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하기 위한 특성 추출부; 상기 특성 추출부를 통해 추출된 각 정보들에 대해 정규 표현 형태의 추출 규칙을 생성하기 위한 규칙 생성부; 및 상기 생성된 추출 규칙을 출력하여, 확인받음에 따라 최종 추출 규칙으로 확정하기 위한 규칙 확정부를 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
4 4
제 3 항에 있어서, 상기 규칙 생성부는, 하나의 정보에 대해, 중복되는 규칙간의 중요도를 판별하기 위하여, 베이시안 네트워크(Bayesian Network)를 이용하여 규칙간의 중요도를 구별하는 것을 특징으로 하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
5 5
제 4 항에 있어서, 여러 규칙들에서 우선순위적 규칙을 판단하기 위해, 도메인과 해당 규칙의 의존관계를 상기 베이시안 네트워크로 구현하여, 규칙과 도메인의 의존관계를 점수화하여 규칙들의 순위를 부여하는 것을 특징으로 하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
6 6
제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 정보추출수단은, 소정의 도메인별 문서에서 분석 대상이 되는 내용을 추출하기 위한 제2 문서 분석부; 상기 제2 문서 분석부를 통해 분석된 결과를 언어사전을 이용하여 언어적 의미를 갖는 단위로 분리하기 위한 제2 언어 분석부; 도메인 온톨로지를 이용하여, 상기 언어적 의미를 갖는 단위(어휘)들 중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체하기 위한 제2 온톨로지 매칭부; 의미적 모호성이 있는 어휘가 대표 어휘(공통적 어휘)로 교체된 상기 언어적 의미를 갖는 어휘들을 상기 추출 규칙에서 찾아내기 위한 규칙 매칭부; 및 상기 추출 규칙에 맵핑된 해당 정보를 추출하기 위한 정보 추출부를 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 시스템
7 7
인터넷상에 존재하는 비구조 웹문서로부터 사용자가 원하는 정형화된 정보를 추출하는 방법에 있어서, 도메인별로 구분된 비정형 데이터를 포함한 비구조 웹문서들의 각 특성 및 도메인별 온톨로지를 이용하여 의미 모호성이 배제된 주요 정보(도메인에서 대표적 성격을 갖는 어휘)의 추출 규칙을 생성하여 저장하는 학습단계; 정보 추출 대상 도메인의 문서 입력시, 상기 문서에서 분석 대상이 되는 내용을 추출하여 언어적 의미를 갖는 단위(어휘)로 분리하고 이중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체하는 온톨로지 매칭단계; 및의미적 모호성이 있는 어휘가 대표 어휘로 교체된 상기 언어적 의미를 갖는 어휘들을 상기 추출 규칙에서 찾아내어 자동으로 주요 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하는 정보추출단계를 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 방법
8 8
제 7 항에 있어서, 상기 정보를 추출하는 유효한 규칙들을 다시 상기 학습단계에 반영하는 단계를 더 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 방법
9 9
제 7 항 또는 제 8 항에 있어서, 상기 학습단계는, 도메인별 문서에서 분석 대상이 되는 내용을 추출하는 문서 분석 단계; 상기 분석된 결과를 언어사전을 이용하여 언어적 의미를 갖는 단위로 분리하는 언어 분석 단계; 도메인 온톨로지를 이용하여, 상기 언어적 의미를 갖는 단위(어휘)들 중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체하는 온톨로지 매칭 단계; 의미적 모호성이 있는 어휘가 대표 어휘로 교체된 상기 언어적 의미를 갖는 어휘들에서 공지의 통계적 정보 추출 방식을 통해 우선순위를 갖는 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하는 특성 추출 단계; 상기 추출된 각 정보들에 대해 정규 표현 형태의 추출 규칙을 생성하는 규칙 생성 단계; 및 상기 생성된 추출 규칙을 출력하여, 확인받음에 따라 최종 추출 규칙으로 확정하여 저장하는 규칙 확정 단계를 포함하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 방법
10 10
제 9 항에 있어서, 상기 규칙 생성 단계에서는, 하나의 정보에 대해, 중복되는 규칙간의 중요도를 판별하기 위하여, 베이시안 네트워크(Bayesian Network)를 이용하여 규칙간의 중요도를 구별하는 것을 특징으로 하는 비구조 웹문서에서 도메인별 정보를 추출하기 위한 방법
11 11
비구조 웹문서에서 도메인별 정보를 추출하기 위하여, 프로세서를 구비한 정보 추출 시스템에, 도메인별로 구분된 비정형 데이터를 포함한 비구조 웹문서들의 각 특성 및 도메인별 온톨로지를 이용하여 의미 모호성이 배제된 주요 정보(도메인에서 대표적 성격을 갖는 어휘)의 추출 규칙을 생성하여 저장하는 학습기능; 정보 추출 대상 도메인의 문서 입력시, 상기 문서에서 분석 대상이 되는 내용을 추출하여 언어적 의미를 갖는 단위(어휘)로 분리하고 이중 의미적 모호성이 있는 어휘를 대표 어휘(공통적 어휘)로 교체하는 온톨로지 매칭기능; 및의미적 모호성이 있는 어휘가 대표 어휘로 교체된 상기 언어적 의미를 갖는 어휘들을 상기 추출 규칙에서 찾아내어 자동으로 주요 정보(도메인에서 대표적 성격을 갖는 어휘)를 추출하는 정보추출기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.