1 |
1
개체명 코퍼스 구축 시스템이 개체명 코퍼스를 구축하는 방법에 있어서,텍스트 제공 시스템에서 제공하는 제목, 링크가 연결되어 있지 않은 단어인 복수의 제1 단어 및 링크가 연결되어 있는 복수의 제2 단어가 포함되어 있는 텍스트를 수신하고, 상기 제목 및 제2 단어를 이용하여 상기 복수의 제1 단어에 링크를 추가하는 단계;링크가 추가된 제1 단어의 의미를 의미 제공 시스템을 통해 제공하기 위하여 URI를 부여하는 단계;상기 URI가 부여된 제1 단어의 개체 타입 정보를 상기 의미 제공 시스템으로부터 확인하고, 확인한 개체 타입 정보에 대응되는 개체 깊이 수준을 조절하는 단계; 및상기 개체 깊이 수준이 조절된 제1 단어에 대한 개체명 코퍼스를 생성하는 단계를 포함하는 개체명 코퍼스 구축 방법
|
2 |
2
제1항에 있어서,상기 제1 단어에 링크를 추가하는 단계는,상기 텍스트 제공 시스템으로부터 제공되는 상기 텍스트를 파싱하여 상기 텍스트에 삽입되어 있는 XML 태그를 삭제하는 단계를 포함하는 개체명 코퍼스 구축 방법
|
3 |
3
제1항에 있어서,상기 제1 단어에 링크를 추가하는 단계는,상기 복수의 제1 단어 중 상기 제목과 일치하는 단어가 있는지 확인하는 단계;상기 제목과 일치하는 제1 단어가 있으면, 상기 제목에 설정되어 있는 링크를 상기 제목과 일치하는 제1 단어의 링크로 추가하는 단계;상기 복수의 제1 단어 중 상기 제2 단어와 일치하는 단어가 있는지 확인하는 단계; 및상기 제2 단어와 일치하는 제1 단어가 있으며, 상기 제2 단어에 설정되어 있는 링크를 상기 제2 단어와 일치하는 제1 단어의 링크로 추가하는 단계를 포함하는 개체명 코퍼스 구축 방법
|
4 |
4
제1항에 있어서,상기 URI를 부여하는 단계는,제1 단어에 추가된 링크의 정보 뒤에 상기 단어에 대응하는 의미를 설명하고 있는 상기 의미 제공 시스템으로 연결될 수 있는 URI를 추가하여 부여하는 개체명 코퍼스 구축 방법
|
5 |
5
제1항에 있어서,상기 개체명 코퍼스는 단어, 상기 단어에 대응하는 품사 및 상기 개체 타입 정보로부터 변환된 개체명 태그를 포함하는 개체명 코퍼스 구축 방법
|
6 |
6
개체명 코퍼스를 구축하는 시스템에 있어서,텍스트 제공 시스템으로부터 제공되는 제목, 링크가 연결되어 있지 않은 단어인 복수의 제1 단어, 링크가 연결되어 있는 복수의 제2 단어가 포함되어 있는 텍스트를 수신하고, 상기 제목 또는 제2 단어를 이용하여 상기 복수의 제1 단어에 링크를 연결하는 링크 추가부;상기 링크 추가부에서 링크가 연결된 복수의 제1 단어에, 단어의 의미를 의미 제공 시스템을 통해 설명하기 위하여, URI를 부여하는 URI 부여부; 및상기 URI가 부여된 제1 단어들의 개체 타입 정보를 상기 의미 제공 시스템을 통해 확인하고, 상기 확인한 개체 타입 정보에 대응하는 계체 깊이 수준을 조절한 후 상기 제1 단어들에 대한 개체명 코퍼스를 생성하는 개체명 확인부를 포함하는 개체명 코퍼스 구축 시스템
|
7 |
7
제6항에 있어서,상기 링크 추가부는, 상기 복수의 제1 단어 중 상기 제목과 일치하는 단어가 있는지 확인하고, 상기 제목과 일치하는 제1 단어가 있으면 상기 제목에 설정되어 있는 링크를 상기 제목과 일치하는 제1 단어의 링크로 추가하고,상기 복수의 제1 단어 중 상기 제2 단어와 일치하는 단어가 있는지 확인한 후, 상기 제2 단어와 일치하는 제1 단어가 있으며, 상기 제2 단어에 설정되어 있는 링크를 상기 제2 단어와 일치하는 제1 단어의 링크로 추가하는 개체명 코퍼스 구축 시스템
|
8 |
8
제6항에 있어서,상기 텍스트 제공 시스템으로부터 제공되는 상기 텍스트를 파싱하여 상기 텍스트에 삽입되어 있는 XML 태그를 삭제하고, XML 태그가 삭제된 텍스트를 상기 링크 추가부로 제공하는 텍스트 파싱부를 포함하는 개체명 코퍼스 구축 시스템
|
9 |
9
제6항에 있어서,상기 텍스트 제공 시스템은 위키피디아이고, 상기 의미 제공 시스템은 디비피디아인 개체명 코퍼스 구축 시스템
|
10 |
10
제6항에 있어서,상기 개체명 확인부는 상기 URI가 부여된 제1 단어들을 질의어를 이용하여 상기 의미 제공 시스템으로부터 개체 타입 정보를 수신하고,상기 질의어는 SPARQL 언어를 이용하는 개체명 코퍼스 구축 시스템
|