1 |
1
형태소 사전(120)을 이용하여 텍스트로 입력된 문장을 형태소 해석하는 형태소 분석부(110)와, 그 형태소 해석에 의해 형태소와 구문정보가 할당된 어절을 가장 마지막 어절부터 왼쪽으로 진행하면서 차례로 각 어절에 대한 단문 분할 알고리즘을 적용, 지배소를 설정하여 문장을 단문 단위로 분할 하는 부분 구문분석부(130)와, 부분 구문분석을 위해 필요한 격조사-용언간의 공기정보를 저장하고 있는 공기정보 데이타 베이스(140)로 이루어진 단문분할 장치(100)와, 분할된 단문 내에서 각 어절에 할당된 구조정보를 이용하여 명사구 생성이 가능한 의존관계에 속하는 경우에 2어절 명사로 생성하는 명사구 생성부(210)와, 그 2어절 명사들에 대해서 명사구 삭제조건을 적용시켜 구조적으로 오류가 있는 잘못된 구조정보로부터 생성된 명사구를 삭제하는 명사구 삭제부(220)와, 오류가 있는 명사구가 삭제된 2어절 명사구를 바탕으로 명사구를 이루는 어절 수에 따라 3어절 이상의 명사구로 통합하는 명사구 통합부(230)와, 명사에 대한 불용어 리스트를 '가능 불용어'와 '불가능 불용어'의 2가지로 구축하여 의미적으로 가치가 떨어지는 명사구를 여과시키는 명사 필터링부(240)로 이루어진 명사구 추출 장치(200)로 구성된 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출장치
|
2 |
2
텍스트로 입력된 문장에 대해 형태소를 해석하는 과정과, 텍스트로 입력된 문장에 대한 형태소 해석이 성공하면, 문장의 마지막 어절부터 왼쪽으로 진행하면서 각 어절의 종류에 따른 분할 알고리즘을 적용, 각 어절의 지배소를 설정하여 단문으로 분할하는 과정과, 분할된 단문 내에서 각 어절에 할당된 구조정보를 이용하여 2어절 명사구를 생성하는 과정과, 2어절 명사구중 구조적 오류가 있는 명사구를 삭제하는 과정과, 명사구 종류에 따라 2어절 명사구로부터 차츰 긴 어절수를 가진 명사구로 통합하는 과정과, 명사에 대한 '가능 불용어'와 '불가능 불용어' 리스트를 이용하여 의미적으로 가치가 떨어지는 명사구를 필터링하는 과정을 수행하도록 이루어진 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
3 |
3
제 2 항에 있어서, 상기 각 어절의 지배소를 설정하는 과정은, 입력 문장에 대한 형태소 해석이 성공하면, 문장의 마지막 어절부터 왼쪽으로 진행하면서 현재 어절이 각각 용언일 때(S6), 필수격 결합 체언일 때(S10), 부사격 결합 체언일 때(S17), 부사나 보조사 결합 체언일 때(S19), 접속조사 결합 체언이나 관형어일 때(S21) 그리고 접속부사일 때(S23) 각기 적용되는 지배소 설정 알고리즘에 의해 지배소 및 의존관계를 설정하는 단계를 수행하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
4 |
4
제 3 항에 있어서, 상기 용언에는 동사와 형용사 및 조용보조어간이 결합된 어절이 포함되고, 상기 필수격 결합 체언은 체언에 주격조사나 목적격 조사가 결합된 형태와 조사가 생략된 체언이며, 상기 부사격 결합 체언은 체언에 부사격 조사가 결합된 형태이고, 상기 부사에는 문장부사와 부사형 전성어미 결합 어절이 속하며, 상기 보조사 결합 체언은 체언에 보조사가 결합된 형태를 말하고 접속조사 결합 체언은 체언에 접속조사가 결합된 어절이며, 상기 관형어에는 체언에 관형격조사가 결합된 형태와 관형사가 속하는 것으로 어절을 분류하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
5 |
5
제 3 항에 있어서, 상기 현재 어절이 용언일 때(S6)는, 그 형태가 관형형일 때(S7)와 관형형이 아닐 때의 두 가지 경우로 다시 나누고, 용언의 형태가 관형형이면 오른쪽으로 가장 가까운 피수식 단문의 지배소를 현재 어절의 지배소로 설정하고(S9), 관형형이 아닌 연결형이나 종지형이면 현재 용언은 그 용언이 포함된 단문의 지배소로 설정하여(S8) 현재 어절의 지배소는 그 자신이 되는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
6 |
6
제 3 항에 있어서, 현재 어절이 필수격 결합 체언인 경우(S10)는, 오른쪽으로 바로 인접한 어절과 먼저 의존관계를 찾고(S11), 의존관계가 있는 지를 판단하여(S12) 의존관계가 있으면, 현재 어절의 지배소는 오른쪽으로 인접한 어절로 설정하며, 의존관계가 없으면 오른쪽에 위치한 어절 중 현재 어절의 지배소로 가능한 어절에 대해서만 의존관계를 찾아(S13) 의존관계가 둘 이상인지를 판단하고(S14), 둘 이상의 의존관계가 찾아질 경우에는(S15) 애매성 해소를 위해서 필수격과 용언 간의 공기정보를 이용하여 높은 값을 가지는 한 개의 의존관계만을 택하여 현재 어절의 지배소로 설정(S16) 하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
7 |
7
제 3 항에 있어서, 상기 현재 어절이 부사격 결합 체언이면(S17), 오른쪽에 위치한 용언들 중 현재 어절을 지배 가능한 용언들과의 공기정보를 각각 조사하여 가장 높은 값을 가지는 용언을 택하여 현재 어절의 지배소로 설정(S18)는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
8 |
8
제 3 항에 있어서, 현재 어절이 부사나 보조사 결합 체언이면(S19), 현재 어절의 지배소로 가능한 용언들 중 오른쪽으로 가장 가까운 용언을 현재 어절의 지배소로 설정(S20) 하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
9 |
9
제 3 항에 있어서, 현재 어절이 접속조사 결합 체언이거나 관형어이면(S21), 지배소로 가능한 체언들 중 오른쪽으로 가장 가까운 체언을 지배소로 설정(S22)는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
10 |
10
제 3 항에 있어서, 현재 어절이 접속부사일 때(S23)는, 문장의 첫어절 인지를 판단(S23) 하여 문장의 첫어절에 위치하면 문장의 마지막 어절을 지배소로 설정하고(S25), 그렇지 않으면 오른쪽으로 인접한 어절과 의존관계를 설정(S26)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
11 |
11
제 2 항에 있어서, 상기 2어절 명사구를 생성하는 과정은, 단문 단위로 할당된 구조정보를 읽고(S31), 그 구조정보가 명사구로 생성 가능한 의존관계에 속하는지를 검사하며(S32), 명사구로 생성 가능한 의존관계에 속하는 경우에 2어절 명사구를 생성(S33)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
12 |
12
제 2 항에 있어서, 상기 명사구 통합 과정은, 명사구 삭제 단계가 완료되면(S38), 각 문장내에서 명사구 통합조건을 검사(S39)하고, 통합조건에 부합되는지를 체크하며(S40), 통합조건에 부합되면, 단문 내에서 생성된 2어절 명사구를 바탕으로 3어절 이상의 명사구로 통합(S41)하는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|
13 |
13
제 2 항에 있어서, 상기 명사구 필터링 과정은 의미적으로 가치가 떨어지는 명사구를 여과하기 위한 명사에 대한 불용어 리스트를 미리 '가능 불용어'와 '불가능 불용어'로 나누어 구축하여 두고, 명사구 통합이 완료(S42) 되면, 상기 불용어 리스트에 의거하여 통합된 명사들을 여과(S43) 시키는 것을 특징으로 하는 문장의 구조 정보를 이용한 명사구 추출방법
|