맞춤기술찾기

이전대상기술

지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템 및 방법

  • 기술번호 : KST2019025595
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 지식베이스를 이용하여 개체명 인식을 위한 코퍼스 생성 시스템 및 방법에 관한 것으로, 위키피디아(Wikipedia)를 이용하여 개체명 컨셉 사전을 구축하는 단계와, 상기 위키피디아의 문장을 추출하고, 상기 추출된 문장을 상기 개체명 컨셉 사전의 개체 타입과 비교하여 일치하는 문장에 대해서 태깅하는 단계와, 프리베이스(Freebase) 관계들 중 상기 개체 타입별 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 단계와, 상기 추출된 관계 내 인스턴스를 포함하는 문장을 웹으로부터 수집하고, 상기 수집된 문장을 상기 프리베이스에서 정의한 상기 개체 타입으로 태깅하는 단계 및 상기 위키피디아를 이용하여 태깅한 문장과 상기 프리베이스를 이용하여 태깅한 문장을 통합하여 개체명 인식 코퍼스를 생성하는 단계를 포함하고, 상기 일치하는 문장에 대해서 태깅하는 단계는, 상기 위키피디아의 모든 문장을 추출 시 상기 위키피디아에 대한 XML 형태의 파일에서 텍스트 이외의 정보를 제거하고, 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하여 추출한다.
Int. CL G06F 17/27 (2006.01.01) G06F 17/28 (2006.01.01)
CPC G06F 40/295(2013.01) G06F 40/295(2013.01) G06F 40/295(2013.01)
출원번호/일자 1020160002116 (2016.01.07)
출원인 서강대학교산학협력단
등록번호/일자 10-1724398-0000 (2017.04.03)
공개번호/일자
공고번호/일자 (20170418) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.01.07)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서정연 대한민국 서울특별시 서초구
2 강상우 대한민국 서울특별시 성북구
3 박영민 대한민국 서울특별시 마포구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인충현 대한민국 서울특별시 서초구 동산로 **, *층(양재동, 베델회관)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 서울특별시 마포구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.01.07 수리 (Accepted) 1-1-2016-0017533-66
2 의견제출통지서
Notification of reason for refusal
2016.09.22 발송처리완료 (Completion of Transmission) 9-5-2016-0676852-96
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.10.31 수리 (Accepted) 1-1-2016-1056809-44
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.10.31 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-1056817-10
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.11 수리 (Accepted) 4-1-2017-5005781-67
6 등록결정서
Decision to grant
2017.03.31 발송처리완료 (Completion of Transmission) 9-5-2017-0232724-04
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.01.22 수리 (Accepted) 4-1-2019-5014626-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
위키피디아(Wikipedia)를 이용하여 개체명 컨셉 사전을 구축하는 단계;상기 위키피디아의 문장을 추출하고, 상기 추출된 문장을 상기 개체명 컨셉 사전의 개체 타입과 비교하여 일치하는 문장에 대해서 태깅하는 단계;프리베이스(Freebase)에 저장된 관계들 중 상기 개체 타입별 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 단계;상기 추출된 관계 내 인스턴스를 포함하는 문장을 웹으로부터 수집하고, 상기 수집된 문장을 상기 프리베이스에서 정의한 상기 개체 타입으로 태깅하는 단계; 및상기 위키피디아를 이용하여 태깅한 문장과 상기 프리베이스를 이용하여 태깅한 문장을 통합하여 개체명 인식 코퍼스를 생성하는 단계;를 포함하고, 상기 일치하는 문장에 대해서 태깅하는 단계는,상기 위키피디아의 모든 문장을 추출 시 상기 위키피디아에 대한 XML 형태의 파일에서 텍스트 이외의 정보를 제거하고, 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하여 추출하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
2 2
제 1 항에 있어서,상기 개체명 컨셉 사전을 구축하는 단계는,상기 위키피디아 각각 페이지의 특징을 표현하는 키워드로 구성된 분류 정보를 이용하여 구축하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
3 3
삭제
4 4
제 1 항에 있어서,상기 일치하는 문장에 대해서 태깅하는 단계는,상기 위키피디아에 대한 XML 형태의 파일에 wikipedia2text(Extracting Text from Wikipedia)를 이용하여 텍스트 이외의 정보를 제거하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
5 5
제 1 항에 있어서,상기 일치하는 문장에 대해서 태깅하는 단계는,WikiXMLSAXParser(Wikipedia XML SAX Parser)를 이용하여 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
6 6
제 1 항에 있어서,상기 개체 타입은,인명(Person, PER), 기관명(Organization, ORG), 지명(Location, LOC)을 포함하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
7 7
제 1 항에 있어서,상기 개체 타입별 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 단계는,상기 프리베이스의 검색엔진(Freebase Easy)의 쿼리(Query)에 상기 개체 타입을 입력하고, 검색된 관계들의 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
8 8
삭제
9 9
위키피디아(Wikipedia)를 이용하여 개체명 컨셉 사전을 구축하는 사전부;상기 위키피디아의 문장을 추출하는 제 1 추출부;상기 제 1 추출부에서 추출한 문장을 상기 사전부의 개체명 컨셉 사전과 비교하여 일치하는 문장에 대해서 태깅하는 제 1 태깅부;프리베이스(Freebase)에 저장된 관계들 중 개체 타입별 인스턴스 보유량에 따라 기설정된 순위까지 관계만을 추출하는 제 2 추출부;제 2 추출부에서 추출된 관계 내 인스턴스를 포함하는 문장을 웹으로부터 수집하고, 상기 수집된 문장을 상기 프리베이스에서 정의한 상기 개체 타입으로 태깅하는 제 2 태깅부; 및상기 제 1 태깅부 및 상기 제 2 태깅부에서 태깅한 각각의 문장을 통합하여 개체명 인식 코퍼스를 생성하는 생성부;를 포함하고, 상기 제 1 추출부는 상기 위키피디아의 모든 문장을 추출 시 상기 위키피디아에 대한 XML 형태의 파일에서 텍스트 이외의 정보를 제거하고, 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하여 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
10 10
제 9 항에 있어서,상기 사전부는,상기 위키피디아 각각 페이지의 특징을 표현하는 키워드로 구성된 분류 정보를 이용하여 상기 개체명 컨셉 사전을 구축하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
11 11
삭제
12 12
제 9 항에 있어서,상기 제 1 추출부는,상기 위키피디아에 대한 XML 형태의 파일에 wikipedia2text(Extracting Text from Wikipedia)를 이용하여 텍스트 이외의 정보를 제거하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
13 13
제 9 항에 있어서,상기 제 1 추출부는,WikiXMLSAXParser(Wikipedia XML SAX Parser)를 이용하여 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
14 14
제 9 항에 있어서,상기 제 2 추출부는,상기 프리베이스의 검색엔진(Freebase Easy)의 쿼리(Query)에 상기 개체 타입을 입력하고, 검색된 관계들의 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 서강대학교 산학협력단 이공학개인기초연구지원사업 스마트 기기의 인공 비서 서비스를 위한 대화 관리 기술 개발