1 |
1
위키피디아(Wikipedia)를 이용하여 개체명 컨셉 사전을 구축하는 단계;상기 위키피디아의 문장을 추출하고, 상기 추출된 문장을 상기 개체명 컨셉 사전의 개체 타입과 비교하여 일치하는 문장에 대해서 태깅하는 단계;프리베이스(Freebase)에 저장된 관계들 중 상기 개체 타입별 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 단계;상기 추출된 관계 내 인스턴스를 포함하는 문장을 웹으로부터 수집하고, 상기 수집된 문장을 상기 프리베이스에서 정의한 상기 개체 타입으로 태깅하는 단계; 및상기 위키피디아를 이용하여 태깅한 문장과 상기 프리베이스를 이용하여 태깅한 문장을 통합하여 개체명 인식 코퍼스를 생성하는 단계;를 포함하고, 상기 일치하는 문장에 대해서 태깅하는 단계는,상기 위키피디아의 모든 문장을 추출 시 상기 위키피디아에 대한 XML 형태의 파일에서 텍스트 이외의 정보를 제거하고, 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하여 추출하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
2 |
2
제 1 항에 있어서,상기 개체명 컨셉 사전을 구축하는 단계는,상기 위키피디아 각각 페이지의 특징을 표현하는 키워드로 구성된 분류 정보를 이용하여 구축하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서,상기 일치하는 문장에 대해서 태깅하는 단계는,상기 위키피디아에 대한 XML 형태의 파일에 wikipedia2text(Extracting Text from Wikipedia)를 이용하여 텍스트 이외의 정보를 제거하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
5 |
5
제 1 항에 있어서,상기 일치하는 문장에 대해서 태깅하는 단계는,WikiXMLSAXParser(Wikipedia XML SAX Parser)를 이용하여 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
6 |
6
제 1 항에 있어서,상기 개체 타입은,인명(Person, PER), 기관명(Organization, ORG), 지명(Location, LOC)을 포함하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
7 |
7
제 1 항에 있어서,상기 개체 타입별 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 단계는,상기 프리베이스의 검색엔진(Freebase Easy)의 쿼리(Query)에 상기 개체 타입을 입력하고, 검색된 관계들의 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 방법
|
8 |
8
삭제
|
9 |
9
위키피디아(Wikipedia)를 이용하여 개체명 컨셉 사전을 구축하는 사전부;상기 위키피디아의 문장을 추출하는 제 1 추출부;상기 제 1 추출부에서 추출한 문장을 상기 사전부의 개체명 컨셉 사전과 비교하여 일치하는 문장에 대해서 태깅하는 제 1 태깅부;프리베이스(Freebase)에 저장된 관계들 중 개체 타입별 인스턴스 보유량에 따라 기설정된 순위까지 관계만을 추출하는 제 2 추출부;제 2 추출부에서 추출된 관계 내 인스턴스를 포함하는 문장을 웹으로부터 수집하고, 상기 수집된 문장을 상기 프리베이스에서 정의한 상기 개체 타입으로 태깅하는 제 2 태깅부; 및상기 제 1 태깅부 및 상기 제 2 태깅부에서 태깅한 각각의 문장을 통합하여 개체명 인식 코퍼스를 생성하는 생성부;를 포함하고, 상기 제 1 추출부는 상기 위키피디아의 모든 문장을 추출 시 상기 위키피디아에 대한 XML 형태의 파일에서 텍스트 이외의 정보를 제거하고, 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하여 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
|
10 |
10
제 9 항에 있어서,상기 사전부는,상기 위키피디아 각각 페이지의 특징을 표현하는 키워드로 구성된 분류 정보를 이용하여 상기 개체명 컨셉 사전을 구축하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
|
11 |
11
삭제
|
12 |
12
제 9 항에 있어서,상기 제 1 추출부는,상기 위키피디아에 대한 XML 형태의 파일에 wikipedia2text(Extracting Text from Wikipedia)를 이용하여 텍스트 이외의 정보를 제거하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
|
13 |
13
제 9 항에 있어서,상기 제 1 추출부는,WikiXMLSAXParser(Wikipedia XML SAX Parser)를 이용하여 상기 텍스트만 남은 XML 형태의 파일을 문장 단위로 분할하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
|
14 |
14
제 9 항에 있어서,상기 제 2 추출부는,상기 프리베이스의 검색엔진(Freebase Easy)의 쿼리(Query)에 상기 개체 타입을 입력하고, 검색된 관계들의 인스턴스 보유량 순서에 따라 기설정된 순위까지 관계만을 추출하는 것을 특징으로 하는 지식베이스를 이용한 개체명 인식 코퍼스 생성 시스템
|