1 |
1
프로세서 및 메모리를 포함하는 언어처리 시스템에서, 입력 문장을 사건구조프레임(Event Structure Frame: ESF)이 주석된 문장으로 출력하는 자동 주석방법으로, 상기 방법은:상기 언어처리 시스템에 의해, 동사를 포함하는 영어 문장을 입력하는 단계;상기 언어처리 시스템에 의해, 상기 입력된 영어 문장에서 동사를 추출하는 단계;상기 언어처리 시스템에 의해, 사전 정의된 사건구조프레임 유형(Event Structure Frame type)과 그에 따른 동사를 분류하는 사건구조프레임 목록(ESF-list)을 구비하고, 영어 단어의 유의어 집단인 신셋(SynSet)을 포함하는 언어자원인 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)에 연결하는 단계;상기 언어처리 시스템에 의해, 상기 추출된 동사에 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘을 이용하여 상기 동사의 신셋과 연결되는 아이디인 오프셋을 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 오프셋을 이용하여 상기 ESFWN에서 상기 동사의 사건구조프레임 유형을 찾아 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 사건구조프레임 유형(Event Structure Frame type)에 해당하는 사건구조프레임(ESF)을 사건구조프레임 목록(ESF-List)에서 찾아 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 동사의 사건구조프레임에서 시간순서를 가진 각각에 시간순서 해당 동사를 삽입하는 단계;상기 언어처리 시스템에 의해, 의미역 라벨러(Semantic Role Labeler)에 연결하는 단계; 상기 언어처리 시스템에 의해, 상기 입력된 영어문장에 의미역 라벨링 알고리즘을 적용하여 동사 고유의 특성에 따라 구성성분이 갖는 의미상 역할인 의미역을 출력하는 단계; 상기 언어처리 시스템에 의해, 논항 삽입 알고리즘을 이용하여 상기 출력된 의미역 해당 텍스트를 사건구조프레임의 각 논항 위치에 삽입하는 단계; 및상기 언어처리 시스템에 의해, 상기 논항이 삽입된 동사중심 사건구조 문장을 출력하는 단계를 포함하고, 상기 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘은 EWISER 또는 EWISER-Wrapper이며,상기 의미역 라벨링 알고리즘은 AllenNLP SRL인, 자동 주석방법
|
2 |
2
제 1항에 있어서,상기 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)은,23개의 사건구조프레임(Event Structure Frame: ESF) 유형을 가지는 주석도구인 GESL(Generator of the Event Structure Lexicon)을 영어동사에 적용하여 23개 유형으로 분류하고, 이를 전문가가 점검하여 68개 유형을 가진 사건구조프레임 목록(ESF-list)으로 최종 분류하여, 상기 워드넷의 2431개 동사의 신셋 24,601개가 각각 상기 68개 ESF-list 유형 중 하나에 연결되도록 상기 2431개 동사의 신셋 24,601개 각각을 해당 동사, 해당 신셋번호, 해당 오프셋 번호, 해당 사건구조프레임 유형을 포함하는 포맷으로 주석한, 68개의 사건구조프레임 유형을 가진 언어자원인,자동 주석방법
|
3 |
3
제 1항에 있어서,상기 사건구조프레임은, 하나의 동사가 지시하는 사건을 시간적 순서를 가진 복수개의 하위사건으로 구성하고, 상기 복수개의 하위사건은 전 상태, 진행 상태, 및 후 상태를 나타내는, 자동 주석방법
|
4 |
4
제 1항에 있어서,상기 논항 삽입 알고리즘은,상기 출력된 의미역을 사건구조프레임의 각 하위사건 해당 위치에 삽입하는,자동 주석방법
|
5 |
5
제 1항에 있어서,상기 시간순서 해당 동사는, 불규칙 굴절 동사 사전에서 추출된 불규칙 동사 및 동사굴절 알고리즘을 적용한 동사의 과거분사형, 현재분사형을 포함하는, 자동 주석방법
|
6 |
6
프로세서 및 메모리를 포함하는 언어처리 시스템에서, 입력 문장을 사건구조프레임(ESF)이 주석된 문장으로 출력하는 자동 주석 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 저장매체로, 상기 저장매체는:상기 언어처리 시스템에 의해, 동사를 포함하는 영어 문장을 입력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 입력된 영어 문장에서 동사를 추출하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 사전 정의된 사건구조프레임 유형(Event Structure Frame type)과 그에 따른 동사를 분류하는 사건구조프레임 목록(ESF-list)을 구비하고, 영어 단어의 유의어 집단인 신셋(SynSet)을 포함하는 언어자원인 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)에 연결하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 추출된 동사에 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘을 이용하여 상기 동사의 신셋과 연결되는 아이디인 오프셋을 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 오프셋을 이용하여 상기 ESFWN에서 상기 동사의 사건구조프레임 유형을 찾아 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 사건구조프레임 유형(Event Structure Frame type)에 해당하는 사건구조프레임(ESF)을 사건구조프레임 목록(ESF-List)에서 찾아 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 동사의 사건구조프레임에서 시간순서를 가진 각각에 시간순서 해당 동사를 삽입하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 의미역 라벨러(Semantic Role Labeler)에 연결하도록 프로그램된 코드 부분; 상기 언어처리 시스템에 의해, 상기 입력된 영어문장에 의미역 라벨링 알고리즘을 적용하여 동사 고유의 특성에 따라 구성성분이 갖는 의미상 역할인 의미역을 출력하도록 프로그램된 코드 부분; 상기 언어처리 시스템에 의해, 논항 삽입 알고리즘을 이용하여 상기 출력된 의미역 해당 텍스트를 사건구조프레임의 각 논항 위치에 삽입하도록 프로그램된 코드 부분; 및상기 언어처리 시스템에 의해, 상기 논항이 삽입된 동사중심 사건구조 문장을 출력하도록 프로그램된 코드 부분을 포함하고, 상기 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘은 EWISER 또는 EWISER-Wrapper이며,상기 의미역 라벨링 알고리즘은 AllenNLP SRL인, 컴퓨터 판독가능 저장매체
|