1 |
1
용언 대역어 선택 용례 데이터베이스와 전문 용어 대역어 사전으로부터 용언 대역어 공기 정보를 추출하여 저장하는 용언 대역어 선택 어휘/의미 공기 데이터베이스;조사 대역어 선택 용례 데이터베이스와 일반 분야 부분 대역 패턴 데이터베이스로부터 조사 대역어 공기 정보를 추출하여 저장하는 조사 대역어 선택 어휘/의미 공기 데이터베이스;소정의 전문 분야의 텍스트 말뭉치를 입력받아 국소단문을 추출하는 단문인식부;상기 국소단문내의 각 어절에 나타나는 조사를 그 조사와 대치되어도 의미 변화가 없는 조사들의 그룹에서 대표성을 가지는 대표형 조사로 대치하고, 각 논항에 나타나는 명사구 혹은 복합명사는 그 헤드명사로 대치하며, 상기 용언 대역어 선택 어휘/의미 공기 데이터베이스를 참조하여 한국어 대역 패턴 후보를 선정하여 출력하는 한국어패턴추출부; 및상기 한국어 대역 패턴 후보에 대한 목적언어 대역 표현을 상기 용언 대역어 선택 어휘/의미 공기 데이터베이스와 조사 대역어 선택 어휘/의미 공기 데이터베이스를 참조하여 생성하는 대역표현생성부;를 포함하는 것을 특징으로 하는 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치
|
2 |
2
제1항에 있어서, 상기 단문인식부는상기 텍스트 말뭉치의 형태소를 분석하는 형태소분석부; 및상기 형태소 분석 결과를 입력받아 관형절을 제외한 국소 단문을 추출하는 국소단문추출부;를 포함하는 것을 특징으로 하는 전문 분야의 부분 대역 패턴 데이터베이스 자동 구축 장치
|
3 |
3
제1항에 있어서, 상기 용언 대역어 선택 어휘/의미 공기 데이터베이스 혹은 조사 대역어 선택 어휘/의미 공기 데이터베이스는전문용어 대역어 사전, 대역어 태깅된 선별적 용례 데이터베이스, 일반 분야의 부분 대역 패턴 데이터베이스를 참조하여 n-그램 공기 정보를 추출하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 장치
|
4 |
4
제3항에 있어서, 상기 n-그램 공기정보는 헤드명사어휘, 조사, 용언으로 형성하는 3-그램, 혹은 조사, 용언으로 형성하는 2-그램 공기 정보인 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 장치
|
5 |
5
(a) 용언 대역어와 조사 대역어 선택을 위한 어휘/의미 공기 정보를 구축하는 단계;(b) 텍스트 말뭉치에 대하여 국소단문을 생성하는 단계;(c) 상기 국소 단문에 대하여 부분 대역 패턴 후보를 생성하는 단계; 및(d) 상기 어휘/의미 공기 정보를 기초로 상기 부분 대역 패턴 후보에 대한 목적언어 대역 표현을 생성하여 저장하는 단계;를 포함하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|
6 |
6
제5항에 있어서, 상기 (a)단계는(a1) 용언 대역어 선택 용례 데이터베이스와 전문 용어 대역어 사전으로부터 용언 대역어 공기 정보를 추출하여 용언 대역어 선택 어휘/의미 공기 데이터베이스를 구축하는 단계; 및(a2) 조사 대역어 선택 용례 데이터베이스와 일반 분야 부분 대역 패턴 데이터베이스로부터 조사 대역어 공기 정보를 추출하여 조사 대역어 선택 어휘/의미 공기 데이터베이스를 구축하는 단계;를 포함하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|
7 |
7
제5항에 있어서, 상기 (b)단계는(b1) 상기 텍스트 말뭉치의 형태소를 분석하는 단계; 및(b2) 상기 형태소 분석 결과에서 관형절을 제외한 국소 단문을 추출하는 단계;를 포함하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|
8 |
8
제6항에 있어서, 상기 (a1)단계는전문용어 대역어 사전, 대역어 태깅된 선별적 용례 데이터베이스들로부터 n-그램 공기 정보를 추출하는 단계;를 포함하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|
9 |
9
제6항에 있어서, 상기 (a2)단계는 조사 대역어 태깅된 선별적 용례 데이터베이스와 일반 부분 대역 패턱 데이터베이스들로부터 n-그램 공기 정보를 추출하는 단계;를 포함하는 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|
10 |
10
제8항 또는 제9항에 있어서, 상기 n-그램 공기 정보는헤드명사어휘, 조사, 용언으로 형성하는 3-그램, 혹은 조사, 용언으로 형성하는 2-그램 공기 정보인 것을 특징으로 하는 전문분야의 부분 대역 패턴 데이터베이스 자동 구축 방법
|