1 |
1
적어도 하나의 프로세서에 의해 동작하는 의존 구문 분석 시스템이 입력 문장의 의존 구문을 분석하는 방법으로서,복수의 어절들을 포함하는 문장을 수신하면, 상기 문장에 대한 제1 임베딩과 제2 임베딩을 생성하고, 상기 제1 임베딩과 제2 임베딩을 병합하여 입력 임베딩으로 생성하는 단계,상기 의존 구문 분석 시스템의 포인터 네트워크가 상기 입력 임베딩을 기초로 상기 문장에 대한 은닉 표상을 생성하는 단계,상기 은닉 표상과 상기 복수의 어절들 중 가장 오른쪽 어절부터 입력으로 받고, 입력된 어절에 대한 의존 관계와 의존 관계명을 예측하여, 상기 입력 임베딩에 대한 관계를 출력하는 단계, 그리고상기 입력 임베딩에 대한 관계를 기초로, 상기 문장에서 각 어절들의 지배소와 의존소를 포함하는 의존 구문 트리를 출력하는 단계를 포함하고,상기 포인터 네트워크는 Right to Left 네트워크인, 의존 구문 분석 방법
|
2 |
2
제1항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 문장을 제1 임베딩 모델에 입력하여 상기 제1 임베딩으로 출력하고,상기 문장을 제2 임베딩 모델에 입력하여 상기 제2 임베딩으로 출력하며,상기 제1 임베딩 모델과 제2 임베딩 모델은 ELMo(Embedding from Language Model) 또는 BERT(Bidirectional Encoder Representations from Transformers) 중 어느 하나의 모델인, 의존 구문 분석 방법
|
3 |
3
제2항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 제1 임베딩 모델에서, 상기 각 어절별 복수의 형태소들 중, 첫 번째 형태소와 마지막 형태소를 병합하여 상기 제1 임베딩으로 출력하고,상기 제2 임베딩 모델에서, 상기 복수의 형태소들 각각의 토큰들 중, 첫 번째 형태소의 첫 번째 토큰과 마지막 형태소의 첫 번째 토큰을 병합하여 상기 제2 임베딩으로 출력하는, 의존 구문 분석 방법
|
4 |
4
제3항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 문장이 형태소 분석되어 있는지 확인하는 단계, 그리고형태소 분석이 완료되지 않았으면, 상기 문장의 상기 각 어절들에 대한 형태소를 분석하는 단계를 포함하는, 의존 구문 분석 방법
|
5 |
5
제4항에 있어서,상기 관계를 출력하는 단계는,상기 포인터 네트워크는 BiLSTM(Bidirectional Long Short-Term Memory)으로 구성된 인코더와 단방향 LSTM으로 구성된 디코더로 구성되고,상기 인코더를 구성하는 어느 하나의 셀이, 복수의 어절들 중 어느 하나의 어절에 대한 입력 임베딩을 수신하는 단계, 상기 셀을 기준으로 제1 방향에 위치한 제1 이전 셀과 제2 방향에 위치한 제2 이전 셀로부터, 각각 이전 셀들까지 처리된 어절별 은닉 표상들을 수신하는 단계, 상기 어절의 입력 임베딩과 어절별 은닉 표상들을 기초로 상기 셀에서 상기 어절에 대한 어절별 출력 표상을 출력하는 단계, 그리고, 상기 디코더로 상기 입력 임베딩의 은닉 표상을 전달하는 단계 를 포함하는, 의존 구문 분석 방법
|
6 |
6
제5항에 있어서,상기 관계를 출력하는 단계는,상기 디코더가 상기 인코더로부터 상기 은닉 표상을 수신하는 단계,상기 인코더로부터 상기 가장 오른쪽 어절부터 입력되는 어절들 중 어느 하나의 어절에 대한 어절별 출력 표상과 상기 제1 이전 셀과 제2 이전 셀에서 각각 출력된 이전 셀들의 어절별 출력 표상을 입력 받는 단계, 그리고상기 은닉 표상, 상기 어절별 출력 표상, 상기 각각 출력된 이전 셀들의 어절별 출력 표상을 기초로, 상기 어느 하나의 어절에 대한 디코더 출력 표상을 출력하는 단계를 포함하는, 의존 구문 분석 방법
|
7 |
7
제6항에 있어서,상기 관계를 출력하는 단계는,상기 어느 하나의 어절에 대한 상기 인코더 출력 표상과 디코더 출력 표상을 기초로, 상기 어느 하나의 어절에 대한 지배소를 출력하는 단계를 포함하는, 의존 구문 분석 방법
|
8 |
8
입력 문장의 의존 구문을 분석하는 시스템으로서,복수의 어절들로 구성된 문장으로부터 제1 임베딩과 제2 임베딩을 생성하고, 상기 생성한 제1 임베딩과 제2 임베딩을 병합하여 입력 임베딩으로 생성하는 임베딩 생성부, 그리고상기 입력 임베딩에서 상기 문장의 오른쪽부터 순차적으로 각 어절별로 의존 관계와 의존 관계명을 예측하고, 상기 예측한 어절별로 의존 관계와 의존 관계명을 포함하는 관계를 출력하는 포인터 네트워크를 포함하고,상기 포인터 네트워크는 Right to Left 포인터 네트워크인, 의존 구문 분석 시스템
|
9 |
9
제8항에 있어서,상기 문장이 형태소 분석되어 있는지 확인하고, 형태소 분석이 완료되지 않았으면 상기 각 어절에 대한 형태소를 분석하는 전처리부를 더 포함하는, 의존 구문 분석 시스템
|
10 |
10
제9항에 있어서,상기 임베딩 생성부는,상기 문장을 상기 제1 임베딩으로 출력하는 제1 임베딩 모델,상기 문장을 상기 제2 임베딩으로 출력하는 제2 임베딩 모델, 그리고상기 제1 임베딩 모델과 제2 임베딩 모델을 병합하는 병합 모델을 포함하고,상기 제1 임베딩 모델과 제2 임베딩 모델은 ELMo(Embedding from Language Model) 또는 BERT(Bidirectional Encoder Representations from Transformers) 중 어느 하나의 모델인, 의존 구문 분석 시스템
|
11 |
11
제10항에 있어서,상기 포인터 네트워크는,BiLSTM으로 구성되며, 각 어절별 입력 임베딩, 각 어절의 형태소, 품사 태그, 이전 어절에서 문장의 구조를 반영한 이전 어절의 대표 값인 어절별 은닉 표상을 기초로 각 어절에 대한 인코더 출력 표상을 출력하고, 마지막 어절의 은닉 표상을 상기 문장의 은닉 표상으로 생성하는 인코더, 그리고상기 문장의 은닉 표상과 각 어절에 대한 인코더 출력 표상을 입력으로 받아, 상기 각 어절에 대한 디코더 출력 표상을 생성하되, 상기 각 어절은 상기 문장의 오른쪽 어절부터 입력되는 디코더를 포함하고,상기 각 어절에 대한 인코더 출력 표상과 디코더 출력 표상을 기초로 상기 각 어절에 대한 지배소를 예측하는, 의존 구문 분석 시스템
|