1 |
1
입력된 문장의 형태소를 분석하는 형태소 분석모듈; 분석된 형태소 정보에서 체언류의 표층형의 추상화된 정보를 데이터베이스로부터 획득하는 체언 추상화 모듈; 및 상기 체언의 추상화된 표층형 정보와 학습 말뭉치로부터 학습된 자질 정보를 이용하여 어절 간 의존관계를 분석하는 의존관계 분석 모듈을 포함하는 전이 기반 한국어 의존관계 분석 시스템
|
2 |
2
제 1 항에 있어서,상기 형태소 분석모듈은, 상기 입력된 문장의 형태소 분석 결과와 동형이의어 분별 결과를 제공하며,상기 형태소 분석결과는 형태소 단위로 표층형, 동형이의어 번호, 다의어 번호, 품사 태그가 부착되어 출력되고, 상기 분석결과로부터 입력 문장의 어절 단위와 형태소 단위로 표층형과 동형이의어 번호, 품사 태그 정보를 수집하는 의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템
|
3 |
3
제 1 항에 있어서, 상기 체언 추상화 모듈은, 어휘 의미망을 활용하여 명사의 표층형을 추상화하여 자질로 사용하며, 상기 어휘 의미망은 명사의 계층 구조를 트리 구조로 제공하며, 상위어 정보를 통해 명사의 표층형 정보를 추상화하는 전이 기반 한국어 의존관계 분석 시스템
|
4 |
4
제 3 항에 있어서,상기 표층형의 추상화는, 학습 말뭉치를 동형이의어로 분별하였고, 동형이의어로 분별된 정보를 기초로 어휘 의미망의 단어 계층에 따라 명사를 추상화하는 전이 기반 한국어 의존관계 분석 시스템
|
5 |
5
제 4 항에 있어서, 상기 명사의 표층형 추상화는, 표층형 자질, 추상화 자질을 포함한 어절단위 자질의 기본자질, 형태소 단위 및 음절 단위 확장 자질을 모두 학습하는 전이 기반 한국어 의존관계 분석 시스템
|
6 |
6
제 3 항에 있어서, 상기 체언 추상화 모듈은, 입력 문장의 형태소 단위의 품사 태그를 확인하여 체언류 형태소를 구분하고,체언류 형태소에 대하여 상기 어휘 의미망에 해당 단어 정보가 있는지 확인하고, 상기 어휘 의미망에 없는 단어는 추상화하지 않고 정보가 있는 단어는 어휘 의미망의 단어 계층을 계산하고, 상기 동형이의어를 기준으로 동형이의어가 갖는 모든 다의어에 대하여 단어 계층을 모두 계산하고, 계산된 모든 다의어에 대하여 설정된 추상화 레벨만큼 상위 계층 단어로 추상화하며, 추상화된 단어 중 빈도가 가장 높은 단어를 해당 동형이의어의 추상화된 단어로 결정하는 전이 기반 한국어 의존관계 분석 시스템
|
7 |
7
제 6 항에 있어서,상기 체언 추상화 모듈은, 추상화의 단계가 최고 단계를 초과하는 경우, 추상화 단계가 어휘 의미망의 최상위 단계 이상이 되면 root 노드 아래의 1계층 단어로 추상화하는 제1 방법과, 추상화를 하지 않고 원형을 그대로 사용하는 제2 방법 중 하나에 의해 수행되는 전이 기반 한국어 의존관계 분석 시스템
|
8 |
8
제 1 항에 있어서, 상기 의존관계 분석모듈은, 한국어의 특징이 고려된 전이 기반 모델에 맞춰 입력 문장의 순서를 역순으로 입력 버퍼에 입력하고, 자질 함수를 통해 각 자질의 값을 구하여 전이(transition)을 결정하며, 상기 전이결정에 따라 상기 입력 버퍼의 모든 어절이 의존관계가 결정되어 입력 버퍼에 존재하는 어절이 없으면 의존관계 분석을 종료하고 입력 문장의 각 어절의 지배소 어절의 어절 위치를 기록하여 의존관계 결과를 출력하는 전이 기반 한국어 의존관계 분석 시스템
|
9 |
9
제 8 항에 있어서,상기 의존관계 분석에 따른 기본 자질 성능 평가에서, 일반화된 품사 태그 자질(generalized POS)이 가장 높은 재현율을 제공하며, 표층형과 동형 이의의 번호, 품사 태그 합 자질(BPS)이 가장 높은 정확율을 제공하는 전이 기반 한국어 의존관계 분석 시스템
|
10 |
10
제 8 항에 있어서, 상기 의존관계 분석에 따른 확장 자질 성능 평가에서, 확장 자질의 재현율과 정확률은 상기 기본 자질에 비해 재현율은 높고, 정확률이 낮은 전이 기반 한국어 의존관계 분석 시스템
|
11 |
11
제 8 항에 있어서, 상기 의존관계 분석에 따른 확장 자질 성능 평가에서, 형태소 자질과 음절 자질을 모두 사용한 경우가 가장 높은 의존관계 정확율을 제공하는 전이 기반 한국어 의존관계 분석 시스템
|
12 |
12
제 1 항에 있어서, 상기 의존관계 분석 모듈의 분석방법은, 한국어의 지배소 후위 원칙을 이용한 수정된 backward arc-eager 알고리즘을 사용하여 전이 기반 의존관계를 분석하고, 상기 수정된 backward arc-eager 알고리즘은 기본 arc-eager 알고리즘에서 right-arc, shift transition은 제거되고 left-arc transition에서 stack의 어절을 제거하지 않고 buffer로 이동시키는 방법으로 분석하는 전이 기반 한국어 의존관계 분석 시스템
|
13 |
13
제 12 항에 있어서, 상기 의존관계 분석에 따른 의존관계정확률 및 자질 정확률은 다음 식에 의해 계산되는 전이 기반 한국어 의존관계 분석 시스템
|