1 |
1
입력 문서에서 문단을 분해하여 인식하는 문단 인식기; 인식된 문단에 대하여 문장을 분리하는 문장 분리기; 분리된 문장 단위에서 지식베이스의 개체를 인식하는 개체 인식기; 인식된 개체 사이의 관계를 지식베이스에서 찾아 개체-관계 그래프를 생성하는 개체 그래프 생성기; 개체-관계 그래프 상에서 중심성을 이용하여 그래프 상의 개체 간 가중치를 계산하는 그래프 가중치 계산기; 계산된 가중치에 기반하여 문단의 중심 개체를 선별하는 중심 개체 선별기; 및선별된 중심 개체를 이용하여 주어 성분이 생략된 문장에 대한 주어를 복원하는 생략 주어 복원기를 포함하는 문장 생성 시스템
|
2 |
2
제1항에 있어서,상기 문단 인식기는, 모든 문서 범위에 대하여 문단 이름을 제목(Heading) 태그로 분리한 HTML 문서이거나 또는 두 개 이상의 공백줄로 분리된 단위의 문장을 포함한 범위를 문단으로 인식하는 문장 생성 시스템
|
3 |
3
제1항에 있어서,상기 문장 분리기는, 마침표, 물음표, 느낌표를 포함하는 구두점으로 구분된 10자 이상의 문자를 포함한 문자열의 집합이거나 또는 줄 바꿈 행으로 구분된 5자 이상의 문자열의 집합을 포함하는 것을 문장으로 분리하는 문장 생성 시스템
|
4 |
4
제1항에 있어서,상기 개체 인식기는, 분리된 문장으로부터 특정 지식베이스를 사전으로 하여 문장 내에 등장하는 특정 기관명, 장소명, 사람이름, 시간표현을 포함하는 다양한 도메인의 개체명을 인식하는 문장 생성 시스템
|
5 |
5
제1항에 있어서,상기 개체 그래프 생성기는, 인식된 문단의 모든 문장에 대하여 개체가 인식된 후, 인식된 개체를 집합으로 구성하고, 구성된 개체 집합의 서로 다른 두 원소를 조합한 개체쌍을 생성하며, 개체쌍 사이의 관계 트리플렛을 지식베이스 내에서 검색하여 개체-관계를 바탕으로 방향그래프(Directed Graph)로 구성하는 문장 생성 시스템
|
6 |
6
제1항에 있어서, 상기 그래프 가중치 계산기는, 상기 중심성은 그래프 내에서 하나의 노드에 연결된 모든 간선의 가중치의 합으로 중심성을 평가하고, 노드로 들어오는 간선인 인-디그리(In-Degree)만 계산하는 경우 해당 노드의 그래프 상에서의 인기도를 측정하고, 아웃-디그리(Out-Degree)만 계산하는 경우 해당 노드의 그래프 상에서의 영향력을 측정하는 문장 생성 시스템
|
7 |
7
제1항에 있어서, 상기 생략 주어 복원기는, 선별된 최종 중심 개체를 사용하여 문장의 가장 앞에 위치시킴으로써 하나의 문장에 개체 단어를 추가하여 문장의 컨텍스트를 확장하고, 최종 중심 개체가 생략된 주어임을 가정하여 복원된 문장에서 나타나는 한 쌍의 개체는 잠재적인 관계 추출의 후보 문장으로 간주되는 문장 생성 시스템
|
8 |
8
문단 인식기를 통해 입력 문서에서 문단을 분해하여 인식하는 단계; 문장 분리기를 통해 상기 인식된 문단에 대하여 문장을 분리하는 단계; 개체 인식기를 통해 상기 분리된 문장 단위에서 지식베이스의 개체를 인식하는 단계; 개체 그래프 생성기를 통해 상기 인식된 개체 사이의 관계를 지식베이스에서 찾아 개체-관계 그래프를 생성하는 단계; 그래프 가중치 계산기를 통해 개체-관계 그래프 상에서 중심성을 이용하여 그래프 상의 개체 간 가중치를 계산하는 단계; 중심 개체 선별기를 통해 상기 계산된 가중치에 기반하여 문단의 중심 개체를 선별하는 단계; 및생략 주어 복원기를 통해 상기 선별된 중심 개체를 이용하여 주어 성분이 생략된 문장에 대한 주어를 복원하는 단계를 포함하는 문장 생성 방법
|
9 |
9
제8항에 있어서,상기 문단 인식기를 통해 입력 문서에서 문단을 분해하여 인식하는 단계는, 모든 문서 범위에 대하여 문단 이름을 제목(Heading) 태그로 분리한 HTML 문서이거나 또는 두 개 이상의 공백줄로 분리된 단위의 문장을 포함한 범위를 문단으로 인식하는 문장 생성 방법
|
10 |
10
제8항에 있어서,상기 문장 분리기를 통해 상기 인식된 문단에 대하여 문장을 분리하는 단계는, 마침표, 물음표, 느낌표를 포함하는 구두점으로 구분된 10자 이상의 문자를 포함한 문자열의 집합이거나 또는 줄 바꿈 행으로 구분된 5자 이상의 문자열의 집합을 포함하는 것을 문장으로 분리하는 문장 생성 방법
|
11 |
11
제8항에 있어서,상기 개체 인식기를 통해 상기 분리된 문장 단위에서 지식베이스의 개체를 인식하는 단계는, 분리된 문장으로부터 특정 지식베이스를 사전으로 하여 문장 내에 등장하는 특정 기관명, 장소명, 사람이름, 시간표현을 포함하는 다양한 도메인의 개체명을 인식하는 문장 생성 방법
|
12 |
12
제8항에 있어서,상기 개체 그래프 생성기를 통해 상기 인식된 개체 사이의 관계를 지식베이스에서 찾아 개체-관계 그래프를 생성하는 단계는, 인식된 문단의 모든 문장에 대하여 개체가 인식된 후, 인식된 개체를 집합으로 구성하고, 구성된 개체 집합의 서로 다른 두 원소를 조합한 개체쌍을 생성하며, 개체쌍 사이의 관계 트리플렛을 지식베이스 내에서 검색하여 개체-관계를 바탕으로 방향그래프(Directed Graph)로 구성하는문장 생성 방법
|
13 |
13
제8항에 있어서,상기 그래프 가중치 계산기를 통해 개체-관계 그래프 상에서 중심성을 이용하여 그래프 상의 개체 간 가중치를 계산하는 단계는, 상기 중심성은 그래프 내에서 하나의 노드에 연결된 모든 간선의 가중치의 합으로 중심성을 평가하고, 노드로 들어오는 간선인 인-디그리(In-Degree)만 계산하는 경우 해당 노드의 그래프 상에서의 인기도를 측정하고, 아웃-디그리(Out-Degree)만 계산하는 경우 해당 노드의 그래프 상에서의 영향력을 측정하는 문장 생성 방법
|
14 |
14
제8항에 있어서,상기 생략 주어 복원기를 통해 상기 선별된 중심 개체를 이용하여 주어 성분이 생략된 문장에 대한 주어를 복원하는 단계는, 선별된 최종 중심 개체를 사용하여 문장의 가장 앞에 위치시킴으로써 하나의 문장에 개체 단어를 추가하여 문장의 컨텍스트를 확장하고, 최종 중심 개체가 생략된 주어임을 가정하여 복원된 문장에서 나타나는 한 쌍의 개체는 잠재적인 관계 추출의 후보 문장으로 간주되는 문장 생성 방법
|