맞춤기술찾기

이전대상기술

데이터분석장치 및 그 동작 방법

  • 기술번호 : KST2022012070
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 분석대상 데이터(예: 특허 데이터, 상표 데이터, 및 논문 데이터)에 특화된 임베딩(Embedding) 벡터를 추출하여 이를 데이터 분석에 활용하기 위한 데이터분석장치 및 그 동작 방법에 관한 것이다.
Int. CL G06F 16/35 (2019.01.01) G06F 16/33 (2019.01.01) G06N 20/00 (2019.01.01)
CPC G06F 16/35(2013.01) G06F 16/3347(2013.01) G06F 16/3344(2013.01) G06F 40/205(2013.01) G06F 40/30(2013.01) G06N 20/00(2013.01) Y10S 707/931(2013.01)
출원번호/일자 1020210013234 (2021.01.29)
출원인 한국과학기술정보연구원
등록번호/일자 10-2311644-0000 (2021.10.05)
공개번호/일자
공고번호/일자 (20211012) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.29)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이재민 경기도 화성
2 하태현 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 남앤남 대한민국 서울특별시 중구 서소문로**(서소문동, 정안빌딩*층)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.29 수리 (Accepted) 1-1-2021-0121466-29
2 [우선심사신청]심사청구서·우선심사신청서
2021.02.01 수리 (Accepted) 1-1-2021-0125735-00
3 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2021.02.08 수리 (Accepted) 9-1-9999-9999999-89
4 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2021.02.10 수리 (Accepted) 9-1-2021-0002205-71
5 의견제출통지서
Notification of reason for refusal
2021.06.04 발송처리완료 (Completion of Transmission) 9-5-2021-0447605-83
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2021.08.03 수리 (Accepted) 1-1-2021-0895860-03
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2021.08.03 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-0895861-48
8 등록결정서
Decision to grant
2021.09.28 발송처리완료 (Completion of Transmission) 9-5-2021-0764729-37
9 [명세서등 보정]보정서(심사관 직권보정)
2021.10.07 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2021-5025070-62
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성부;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출부; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공부를 포함하는 것을 특징으로 하는 데이터분석장치
2 2
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성부;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출부; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공부를 포함하며,상기 제공부는,상기 전용언어모델이 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 분류코드 연계가 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별로 평균하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별 임베딩 벡터의 평균 값을 상기 제1분석대상 데이터와 상기 제2분석대상데이터 간에 상호 비교하여 유사도가 임계치 이상인 분류코드 쌍을 검출하는 것을 특징으로 하는 데이터분석장치
3 3
제 1 항 또는 제 2 항에 있어서,상기 생성부는,상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트가 입력 값이 되고, 상기 분석대상 데이터를 분류하는 분류코드가 출력 값이 되는 학습 데이터 셋을 상기 사전훈련언어모델을 통해서 학습하여 상기 전용언어모델을 생성하는 것을 특징으로 하는 데이터분석장치
4 4
제 3 항에 있어서,상기 생성부는,상기 분석대상 데이터에 부여될 수 있는 분류코드를 포함한 완전연결계층(Fully connected layer)을 상기 사전훈련언어모델에 연결시켜, 상기 완전연결계층을 기반으로 상기 사전훈련언어모델을 지도 학습하는 것을 특징으로 하는 데이터분석장치
5 5
제 4 항에 있어서,상기 추출부는,상기 전용언어모델의 생성에 따라 상기 전용언어모델에 연결된 상태인 상기 완전연결계층을 제거하여, 상기 전용언어모델로 입력되는 상기 특정 데이터 필드의 텍스트에 대한 임베딩 벡터를 추출하는 것을 특징으로 하는 데이터분석장치
6 6
제 5 항에 있어서,상기 제공부는,상기 분석대상 데이터에 대한 분류코드의 추천이 요구되는 경우, 상기 전용언어모델에 대한 상기 완전연결계층의 연결을 유지시켜, 상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트 입력 시 상기 전용언어모델을 거쳐 상기 완전연결계층을 통해 출력되는 분류코드를 반환하는 것을 특징으로 하는 데이터분석장치
7 7
제 1 항 또는 제 2 항에 있어서,상기 제공부는,특정 기업이 보유한 분석대상 데이터에 대한 비교 분석이 요구되는 경우, 상기 특정 기업이 보유한 분석대상 데이터에 대해서 추출되는 임베딩(Embedding) 벡터의 평균값을 상기 특정 기업에 대한 대표 임베딩 벡터로 산출하며, 상기 특정 기업의 대표 임베딩 벡터를 상기 특정 기업과는 다른 타 기업의 대표 임베딩 벡터와 비교하여 기업 간 유사도를 판단하는 것을 특징으로 하는 데이터분석장치
8 8
삭제
9 9
삭제
10 10
제 1 항 또는 제 2 항에 있어서,상기 분석대상 데이터는,특허 데이터, 상표 데이터, 및 논문 데이터 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터분석장치
11 11
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성단계;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출단계; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공단계를 포함하며,상기 제공단계는,상기 전용언어모델이, 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 비교 분석이 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상호 비교하여 유사도가 임계치 이하 또는 이상인 분석대상 데이터 쌍을 검출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
12 12
분석대상 데이터의 텍스트를 대상으로 사전훈련언어모델을 파인 튜닝(Fine-Tuning)하여 상기 사전훈련언어모델로부터 상기 분석대상 데이터를 위한 전용언어모델을 생성하는 생성단계;상기 전용언어모델을 통해 상기 분석대상 데이터에 대한 임베딩(Embedding) 벡터를 추출하는 추출단계; 및상기 임베딩 벡터에 기초하여 상기 분석대상 데이터에 관한 분석 서비스를 제공하는 제공단계를 포함하며,상기 제공단계는,상기 전용언어모델이, 제1분석대상 데이터와 상기 제1분석대상 데이터와는 이종의 데이터인 제2분석대상 데이터의 텍스트 모두를 대상으로 상기 사전훈련언어모델을 파인 튜닝한 언어모델인 연계언어모델을 포함하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 간 분류코드 연계가 요구되는 경우, 상기 연계언어모델을 통해서 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각에 대해 추출되는 임베딩 벡터를 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별로 평균하며, 상기 제1분석대상 데이터와 상기 제2분석대상 데이터 각각의 분류코드 별 임베딩 벡터의 평균 값을 상기 제1분석대상 데이터와 상기 제2분석대상데이터 간에 상호 비교하여 유사도가 임계치 이상인 분류코드 쌍을 검출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
13 13
제 11 항 또는 제 12 항에 있어서,상기 생성단계는,상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트가 입력 값이 되고, 상기 분석대상 데이터를 분류하는 분류코드가 출력 값이 되는 학습 데이터 셋을 상기 사전훈련언어모델을 통해서 학습하여 상기 전용언어모델을 생성하는 것을 특징으로 하는 데이터분석장치의 동작 방법
14 14
제 13 항에 있어서,상기 생성단계는,상기 분석대상 데이터에 부여될 수 있는 분류코드를 포함한 완전연결계층(Fully connected layer)을 상기 사전훈련언어모델에 연결시켜, 상기 완전연결계층을 기반으로 상기 사전훈련언어모델을 지도 학습하는 것을 특징으로 하는 데이터분석장치의 동작 방법
15 15
제 14 항에 있어서,상기 추출단계는,상기 전용언어모델의 생성에 따라 상기 전용언어모델에 연결된 상태인 상기 완전연결계층을 제거하여, 상기 전용언어모델로 입력되는 상기 특정 데이터 필드의 텍스트에 대한 임베딩 벡터를 추출하는 것을 특징으로 하는 데이터분석장치의 동작 방법
16 16
제 15 항에 있어서,상기 제공단계는,상기 분석대상 데이터에 대한 분류코드의 추천이 요구되는 경우, 상기 전용언어모델에 대한 상기 완전연결계층의 연결을 유지시켜, 상기 분석대상 데이터가 가지는 특정 데이터 필드의 텍스트 입력 시 상기 전용언어모델을 거쳐 상기 완전연결계층을 통해 출력되는 분류코드를 반환하는 것을 특징으로 하는 데이터분석장치의 동작 방법
17 17
제 11 항 또는 제 12 항에 있어서,상기 제공단계는,특정 기업이 보유한 분석대상 데이터에 대한 비교 분석이 요구되는 경우, 상기 특정 기업이 보유한 분석대상 데이터에 대해서 추출되는 임베딩(Embedding) 벡터의 평균값을 상기 특정 기업에 대한 대표 임베딩 벡터로 산출하며, 상기 특정 기업의 대표 임베딩 벡터를 상기 특정 기업과는 다른 타 기업의 대표 임베딩 벡터와 비교하여 기업 간 유사도를 판단하는 것을 특징으로 하는 데이터분석장치의 동작 방법
18 18
삭제
19 19
삭제
20 20
제 11 항 또는 제 12 항에 있어서,상기 분석대상 데이터는,특허 데이터, 상표 데이터, 및 논문 데이터 중 적어도 하나를 포함하는 것을 특징으로 하는 데이터분석장치의 동작 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술정보연구원 한국과학기술정보연구원연구운영비지원(R&D)(주요사업비) 데이터 기반 지능형 미래기술 분석체제 구축