1 |
1
적어도 하나의 프로세서에 의해 동작하는 법률 문서 유사도 분석 시스템이 대상 문서와 유사 문서의 유사도를 분석하는 방법으로서,상기 대상 문서 및 복수의 문서들을 포함하는 문서 집합으로부터, 문서 표현 집합을 추출하는 단계,상기 추출한 문서 표현 집합을 이용하여 상기 대상 문서와 유사 문서를 포함하여 관련 문서 집합을 생성하는 단계, 그리고상기 문서 표현 집합과 상기 관련 문서 집합을 이용하여, 상기 대상 문서와 상기 유사 문서 사이의 유사도를 나타내는 가중치 행렬을 출력하는 단계를 포함하고, 상기 대상 문서와 유사 문서를 포함하는 복수의 문서들은 법률 문서인, 문서 유사도 분석 방법
|
2 |
2
제1항에 있어서,상기 문서 표현 집합을 추출하는 단계는,중첩된 어텐션 네트워크 모델을 이용하여, 상기 문서 집합에 포함된 각 문서들에 대해 문서 내 단어들에 대한 단어 가중치를 생성하는 단계, 그리고상기 중첩된 어텐션 네트워크 모델을 이용하여, 각 문서의 문서 표현 벡터를 생성하는 단계를 포함하고,상기 문서 표현 집합은 상기 단어 가중치와 문서 표현 벡터를 쌍으로 포함하는, 문서 유사도 분석 방법
|
3 |
3
제2항에 있어서,상기 문서 표현 집합을 추출하는 단계 이전에,임의의 문서를 전처리하여 상기 임의의 문서에 해당하는 다차원 벡터를 생성하는 단계,상기 다차원 벡터와 상기 임의의 문서에 매핑되어 있는 레이블을 포함하는 학습 데이터를 생성하는 단계, 그리고상기 문서 집합으로부터 문서 표현 집합을 추출하는 문서 분류부를 상기 임의의 문서를 입력하면 상기 레이블이 출력되도록 학습시키는 단계를 포함하고,상기 문서 분류부는 전이 학습된 네트워크 모델인, 문서 유사도 분석 방법
|
4 |
4
제3항에 있어서,상기 관련 문서 집합을 생성하는 단계는,상기 대상 문서의 문서 표현 벡터와, 상기 대상 문서를 제외한 상기 문서 집합에 포함된 각 문서의 문서 표현 벡터를 내적 연산하여 유사도 값을 확인하는 단계, 그리고복수의 유사도 값을 기초로 미리 설정된 수만큼의 유사도 값들을 확인하고, 상기 확인한 유사도 값들이 계산된 문서들을 상기 대상 문서와 관련된 관련 문서들로 설정하는 단계를 포함하는, 문서 유사도 분석 방법
|
5 |
5
제4항에 있어서,상기 가중치 행렬을 출력하는 단계는,상기 관련 문서 집합에 포함된 각 문서의 문서 표현 집합과 상기 대상 문서의 문서 표현 집합을 행렬 곱 연산하는 단계, 그리고상기 행렬 곱 연산을 통해 상기 관련 문서들에 포함된 각 유사 문서와 상기 대상 문서 내의 단어들 사이의 상기 가중치 행렬을 생성하는 단계를 포함하는, 문서 유사도 분석 방법
|
6 |
6
제5항에 있어서,상기 가중치 행렬을 출력하는 단계는,상기 가중치 행렬을 기초로 상기 대상 문서와 유사 문서에 포함된 단어들에 미리 설정된 표시 수단으로 시각화하는 단계를 더 포함하고,상기 시각화하는 단계는,상기 관련 문서 집합에 포함된 각 문서별로 계산된 가중치에 따라, 상기 각 문서에 포함된 단어들을 제1 표시 수단으로 시각화하는 단계, 그리고상기 대상 문서와 상기 유사 문서의 교차 가중치에 따라, 상기 대상 문서와 관련 문서에 포함된 단어들을 제2 표시 수단으로 시각화하는 단계를 포함하는, 문서 유사도 분석 방법
|
7 |
7
대상 법률 문서와 유사 법률 문서의 유사도를 분석하는 법률 문서 유사도 분석 시스템으로서,상기 대상 법률 문서와 상기 유사 법률 문서를 포함하는 복수의 법률 문서들의 문서 집합을 수신하면, 상기 문서 집합에 포함된 복수의 법률 문서들 각각의 단어 가중치와 문서 표현 벡터로 구성된 문서 표현 집합을 추출하는 문서 분류부,상기 문서 표현 집합에 포함된 상기 대상 법률 문서에 대한 문서 표현 집합과 상기 대상 법률 문서를 제외한 나머지 문서들 각각의 문서 표현 집합을 연산하여, 상기 대상 법률 문서의 문서 표현 집합과 유사도가 기 설정된 기준치 이상인 복수의 유사 문서들의 문서 표현 집합들을 포함하는 관련 문서 집합을 생성하는 유사도 계산부, 그리고상기 문서 분류부에서 추출한 상기 문서 표현 집합과, 상기 유사도 계산부에서 생성한 상기 관련 문서 집합을 기초로 상기 대상 문서와 유사 문서의 유사도를 분석하고, 연관 관계를 가지는 단어들을 나타내는 가중치 행렬을 출력하는 유사 분석부를 포함하는, 법률 문서 유사도 분석 시스템
|
8 |
8
제7항에 있어서,입력된 법률 문서로부터 다차원 벡터를 생성하고, 상기 다차원 벡터와 상기 법률 문서에 매핑되어 있는 문서 종류를 나타내는 레이블을 포함하는 학습 데이터로 생성하는 문서 전처리부를 더 포함하는, 법률 문서 유사도 분석 시스템
|
9 |
9
제8항에 있어서,상기 문서 전처리부는,상기 문서 집합을 수신하면, 상기 문서 집합에 포함된 상기 대상 법률 문서와 유사 법률 문서를 포함하는 복수의 법률 문서들의 다차원 벡터를 각각 생성하는, 법률 문서 유사도 분석 시스템
|
10 |
10
제9항에 있어서,상기 문서 전처리부는,상기 입력된 법률 문서를 구성하는 복수의 섹션들을 각각 분리하여, 섹션을 구분하기 위한 태그를 복수의 섹션에 해당하는 텍스트 맨 앞에 삽입하는, 법률 문서 유사도 분석 시스템
|
11 |
11
제10항에 있어서,상기 문서 분류부는,상기 문서 전처리부가 생성한 학습 데이터를 기초로, 상기 입력된 법률 문서가 입력되면 상기 레이블이 출력되도록 분류기를 학습시키는, 법률 문서 유사도 분석 시스템
|
12 |
12
제11항에 있어서,상기 문서 분류부는,상기 문서 집합의 복수의 법률 문서들 각각의 단어들에 대한 단어 가중치를 생성하고, 각 법률 문서의 문서 표현 벡터를 생성하며, 상기 단어 가중치와 상기 문서 표현 벡터를 쌍으로 가지는 상기 문서 표현 집합을 생성하는, 법률 문서 유사도 분석 시스템
|
13 |
13
제12항에 있어서,상기 유사도 계산부는,상기 대상 법률 문서의 문서 표현 벡터와, 상기 문서 집합에 포함된 법률 문서들 중 상기 대상 법률 문서를 제외한 나머지 각 문서의 문서 표현 벡터를 내적 연산하여 유사도를 계산하는, 법률 문서 유사도 분석 시스템
|
14 |
14
제13항에 있어서,상기 분석부는,상기 문서 표현 집합과 상기 문서 표현 집합을 행렬 곱 연산하여, 상기 관련 문서 집합에 포함된 각 법률 문서와 상기 대상 법률 문서 내의 단어들 사이의 상기 가중치 행렬을 출력하는, 법률 문서 유사도 분석 시스템
|
15 |
15
제14항에 있어서,상기 분석부는,상기 가중치 행렬을 기초로 상기 대상 법률 문서와 나머지 각 문서에 포함된 단어들을 미리 설정된 표시 수단으로 시각화하는, 법률 문서 유사도 분석 시스템
|