1 |
1
질의 형태를 갖는 적어도 하나의 입력문장을 입력데이터로 입력받는 입력부;상기 입력문장의 구조적 특성을 반영하여 모방데이터를 생성하고, 상기 모방데이터와 사전에 학습된 언어모델로부터 생성된 비교데이터를 비교하여 상기 입력문장에 대한 유형을 결정하여 출력데이터를 생성하는 분류수단; 및상기 출력데이터가 출력되는 출력부를 포함하는 문장 분류 시스템
|
2 |
2
제 1 항에 있어서,상기 분류수단은,상기 입력문장의 상기 구조적 특성을 분석하여 분석데이터를 생성하는 문장분석수단;상기 분석데이터 및 외부 노이즈를 입력받아 상기 입력문장에 대한 유형을 예측하여 상기 모방데이터를 생성하는 생성수단;복수의 질의문장들 각각의 유형에 대한 분류를 사전에 학습하고, 상기 입력문장에 대응하는 유형을 특정하여 상기 비교데이터를 생성하는 언어학습모델; 및상기 모방데이터와 상기 비교데이터를 비교하여 상기 출력데이터를 생성하는 구별수단을 포함하는 질의문장 분류 시스템
|
3 |
3
제 2 항에 있어서,상기 문장분석수단은,상기 입력문장을 복수의 단위단어(sub-word)들로 토큰화하여 제1 중간데이터를 생성하는 토크나이저;상기 토크나이저로부터 상기 제1 중간데이터를 수신하고, 상기 단위단어들 사이의 위계 관계를 분석하여 상기 입력 문장의 구조를 결정하고, 상기 구조를 파스 트리 형태로 만들어 제2 중간데이터를 생성하는 파싱부; 및상기 제2 중간데이터를 기초로 상기 분석데이터를 생성하는 추출부를 포함하는 질의문장 분류 시스템
|
4 |
4
제 3 항에 있어서,상기 생성수단은 상기 구별수단으로부터 기출력된 기출력데이터를 참조하여 상기 입력문장에 대한 유형을 예측하는 질의문장 분류 시스템
|
5 |
5
제 3 항에 있어서,상기 문장분석수단은 상기 분석데이터를 복수 차례 생성하고, 상기 구별수단은 상기 출력데이터를 복수 차례 생성하고, 상기 생성수단은 상기 모방데이터를 복수 차례 생성하고, 상기 언어학습모델은 상기 비교데이터를 복수 차례 생성하고,상기 구별수단으로부터 생성된 제n 차 출력데이터는 상기 생성수단에 전송되고,상기 생성수단은 상기 제n 차 출력데이터를 제n+1 차 분석데이터 및 상기 외부 노이즈와 함께 입력받아 상기 입력 문장에 대한 유형을 예측하여 제n+1 차 모방데이터를 생성하고,상기 구별수단은 상기 제n+1 차 모방데이터 및 제n+1 차 비교데이터와의 차이를 비교하여 제n+1 차 출력데이터를 생성하고,상기 n는 1 이상의 자연수인 질의문장 분류 시스템
|
6 |
6
제 4 항에 있어서,상기 생성수단은,상기 분석데이터, 상기 외부 노이즈, 및 상기 기출력데이터를 입력받아, 상기 분석데이터, 상기 외부 노이즈, 및 상기 기출력데이터를 동일 차원의 벡터 형태로 변환 및 합성하여 가공데이터를 생성하는 전처리부; 및상기 가공데이터를 입력받아 상기 입력 문장에 대한 유형을 예측하여 상기 모방데이터를 생성하는 제너레이터를 포함하는 질의문장 분류 시스템
|
7 |
7
제 3 항에 있어서,상기 추출부는 상기 파스 트리 형태의 상기 제2 중간데이터를 입력받아 벡터 형태의 상기 분석데이터를 생성하는 그래프 신경망(GNN, Graph Neural Network)을 포함하는 질의문장 분류 시스템
|
8 |
8
제 7 항에 있어서,상기 그래프 신경망은 GraphSAGE인 질의문장 분류 시스템
|
9 |
9
제 2 항에 있어서,상기 언어학습모델은 BERT 모델(Bidirectional Encoder Representations from Transformers Model)인 질의문장 분류 시스템
|
10 |
10
제 3 항에 있어서,상기 파싱부는 상기 단위단어들 사이의 의존 관계를 분석하는 의존성 파서(Dependency parser)를 포함하는 질의문장 분류 시스템
|
11 |
11
제 1 항에 있어서,상기 출력데이터는 상기 입력문장의 유형 후보들 각각에 대한 확률값의 집합인 질의문장 분류 시스템
|
12 |
12
제 7 항에 있어서,상기 입력부에 입력되는 입력문장에 대한 유형 분류 정확도는 51% 이상인 질의문장 분류 시스템
|
13 |
13
제 7 항에 있어서,상기 입력부에 동일한 입력문장이 제m 차례 반복 입력되고, 상기 출력부로부터 제1 내지 제m 출력데이터들이 출력되고,상기 m이 10 이하인 자연수일 때, 상기 제m 출력데이터에 대한 상기 유형 분류 정확도의 최대값은 62
|
14 |
14
제 7 항에 있어서,상기 입력부에 입력 가능한 상기 입력문장의 최대 개수는 5452개 이상인 질의문장 분류 시스템
|
15 |
15
입력부가 문장분석수단 및 언어학습모델 각각에 질의 형태를 갖는 적어도 하나의 입력문장을 입력하는 단계;상기 문장분석수단이 상기 입력문장의 구조적 특징을 분석하여 분석데이터를 생성하는 단계;생성수단이 상기 분석데이터 및 외부 노이즈를 입력받아 상기 입력문장에 대한 유형을 예측하여 모방데이터를 생성하는 단계;복수의 질의문장들 각각의 유형에 대한 분류가 사전에 학습된 언어학습모델이 상기 입력문장에 대응하는 유형을 특정하여 비교데이터를 생성하는 단계;구별수단이 상기 모방데이터와 상기 비교데이터를 비교하여 출력데이터를 생성하는 단계를 포함하는 질의문장 분류 방법
|
16 |
16
제 15 항에 있어서,상기 단계들 각각은 복수 차례 반복 수행되고,제n 차 출력데이터 생성 단계에서, 상기 제n 차 출력데이터는 상기 생성수단에 재입력되고,제n+1 차 모방데이터를 생성하는 단계에서, 상기 생성수단은 상기 재입력된 제n 차 출력데이터, 제n+1차 분석데이터, 상기 외부 노이즈를 기초로하여 제n+1 차 입력문장에 대한 유형을 예측하는 질의문장 분류 방법
|
17 |
17
제 15 항에 있어서,상기 분석데이터를 생성하는 단계는,토크나이저가 상기 입력문장을 복수의 단위단어(sub-word)들로 토큰화하여 제1 중간데이터를 생성하는 단계;파싱부가 상기 제1 중간데이터를 수신하여 상기 단위단어들 사이의 위계 관계를 분석하여 상기 입력 문장의 구조를 결정하는 단계;파싱부가 상기 입력 문장의 구조를 파스 트리 형태로 만들어 제2 중간데이터를 생성하는 단계; 및그래프 신경망(GNN, Graph Neural Network)이 상기 제2 중간데이터를 입력받아 벡터 형태의 상기 분석데이터를 생성하는 단계를 포함하는 질의문장 분류 방법
|
18 |
18
제 15 항에 있어서,상기 모방데이터를 생성하는 단계는,상기 생성수단의 전처리부가 상기 분석데이터, 상기 외부 노이즈 및 기출력데이터를 동일 차원의 벡터 형태로 변환 및 합성하여 가공데이터를 생성하는 단계; 및상기 생성수단의 제너레이터가 상기 가공데이터를 입력받고, 상기 입력 문장에 대한 유형을 예측하여 상기 모방데이터를 생성하는 단계를 포함하는 질의문장 분류 방법
|