1 |
1
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성부;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출부; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공부를 포함하는 것을 특징으로 하는 데이터분석장치
|
2 |
2
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성부;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출부; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공부를 포함하며,상기 제공부는,상기 전용언어모델이 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 분류코드 연계가 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별로 평균하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별 임베딩 벡터의 평균 값을 상기 제1분석대상 데이터와 상기 제2분석대상데이터 간에 상호 비교하여 유사도가 임계치 이상인 분류코드 쌍을 검출하는 것을 특징으로 하는 데이터분석장치
|
3 |
3
제 1 항 또는 제 2 항에 있어서,상기 생성부는,상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트가 입력 값이 되고, 상기 분석대상 데이터를 분류하는 분류코드가 출력 값이 되는 학습 데이터 셋을 상기 사전훈련언어모델을 통해서 학습하여 상기 전용언어모델을 생성하는 것을 특징으로 하는 데이터분석장치
|
4 |
4
제 3 항에 있어서,상기 생성부는,상기 분석대상 데이터에 부여될 수 있는 분류코드를 포함한 완전연결계층(Fully connected layer)을 상기 사전훈련언어모델에 연결시켜, 상기 완전연결계층을 기반으로 상기 사전훈련언어모델을 지도 학습하는 것을 특징으로 하는 데이터분석장치
|
5 |
5
제 4 항에 있어서,상기 추출부는,상기 전용언어모델의 생성에 따라 상기 전용언어모델에 연결된 상태인 상기 완전연결계층을 제거하여, 상기 전용언어모델로 입력되는 상기 특정 데이터 필드의 텍스트에 대한 임베딩 벡터를 추출하는 것을 특징으로 하는 데이터분석장치
|
6 |
6
제 5 항에 있어서,상기 제공부는,상기 분석대상 데이터에 대한 분류코드의 추천이 요구되는 경우, 상기 전용언어모델에 대한 상기 완전연결계층의 연결을 유지시켜, 상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트 입력 시 상기 전용언어모델을 거쳐 상기 완전연결계층을 통해 출력되는 분류코드를 반환하는 것을 특징으로 하는 데이터분석장치
|
7 |
7
제 1 항 또는 제 2 항에 있어서,상기 제공부는,특정 기업이 보유한 분석대상 데이터에 대한 비교 분석이 요구되는 경우, 상기 특정 기업이 보유한 분석대상 데이터에 대해서 추출되는 임베딩(Embedding) 벡터의 평균값을 상기 특정 기업에 대한 대표 임베딩 벡터로 산출하며, 상기 특정 기업의 대표 임베딩 벡터를 상기 특정 기업과는 다른 타 기업의 대표 임베딩 벡터와 비교하여 기업 간 유사도를 판단하는 것을 특징으로 하는 데이터분석장치
|
8 |
8
삭제
|
9 |
9
삭제
|
10 |
10
제 1 항 또는 제 2 항에 있어서,상기 분석대상 데이터는,특허 데이터, 상표 데이터, 및 논문 데이터 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터분석장치
|
11 |
11
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성단계;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출단계; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공단계를 포함하며,상기 제공단계는,상기 전용언어모델이, 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 비교 분석이 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상호 비교하여 유사도가 임계치 이하 또는 이상인 분석대상 데이터 쌍을 검출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
12 |
12
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성단계;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출단계; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공단계를 포함하며,상기 제공단계는,상기 전용언어모델이, 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 분류코드 연계가 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별로 평균하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별 임베딩 벡터의 평균 값을 상기 제1분석대상 데이터와 상기 제2분석대상데이터 간에 상호 비교하여 유사도가 임계치 이상인 분류코드 쌍을 검출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
13 |
13
제 11 항 또는 제 12 항에 있어서,상기 생성단계는,상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트가 입력 값이 되고, 상기 분석대상 데이터를 분류하는 분류코드가 출력 값이 되는 학습 데이터 셋을 상기 사전훈련언어모델을 통해서 학습하여 상기 전용언어모델을 생성하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
14 |
14
제 13 항에 있어서,상기 생성단계는,상기 분석대상 데이터에 부여될 수 있는 분류코드를 포함한 완전연결계층(Fully connected layer)을 상기 사전훈련언어모델에 연결시켜, 상기 완전연결계층을 기반으로 상기 사전훈련언어모델을 지도 학습하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
15 |
15
제 14 항에 있어서,상기 추출단계는,상기 전용언어모델의 생성에 따라 상기 전용언어모델에 연결된 상태인 상기 완전연결계층을 제거하여, 상기 전용언어모델로 입력되는 상기 특정 데이터 필드의 텍스트에 대한 임베딩 벡터를 추출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
16 |
16
제 15 항에 있어서,상기 제공단계는,상기 분석대상 데이터에 대한 분류코드의 추천이 요구되는 경우, 상기 전용언어모델에 대한 상기 완전연결계층의 연결을 유지시켜, 상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트 입력 시 상기 전용언어모델을 거쳐 상기 완전연결계층을 통해 출력되는 분류코드를 반환하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
17 |
17
제 11 항 또는 제 12 항에 있어서,상기 제공단계는,특정 기업이 보유한 분석대상 데이터에 대한 비교 분석이 요구되는 경우, 상기 특정 기업이 보유한 분석대상 데이터에 대해서 추출되는 임베딩(Embedding) 벡터의 평균값을 상기 특정 기업에 대한 대표 임베딩 벡터로 산출하며, 상기 특정 기업의 대표 임베딩 벡터를 상기 특정 기업과는 다른 타 기업의 대표 임베딩 벡터와 비교하여 기업 간 유사도를 판단하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|
18 |
18
삭제
|
19 |
19
삭제
|
20 |
20
제 11 항 또는 제 12 항에 있어서,상기 분석대상 데이터는,특허 데이터, 상표 데이터, 및 논문 데이터 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터분석장치의 동작 방법
|