맞춤기술찾기

이전대상기술

관계형 테이블 임베딩 장치 및 방법

  • 기술번호 : KST2023005860
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 관계형 테이블에 대한 임베딩 장치 및 방법에 관한 것이다. 상기 임베딩 장치는, 각 컬럼의 명칭에 대한 컬럼헤딩 및 상기 각 컬럼의 셀들의 데이터 집합인 레코드를 포함하는 관계형 테이블과, 상기 관계형 테이블의 메타 데이터에 대한 임베딩 장치에 있어서, 상기 메타 데이터에 대한 임베딩을 수행하여 메타 데이터 임베딩 벡터를 생성하고, 상기 컬럼헤딩에 대한 임베딩을 수행하여 컬럼헤딩 인베딩 벡터를 생성하는 제1 임베딩부, 상기 레코드에 대한 임베딩을 수행하여 레코드 임베딩 벡터를 생성하는 제2 임베딩부 및 상기 메타 데이터 임베딩 벡터, 컬럼헤딩 임베딩 벡터 및 상기 레코드 임베딩 벡터를 기초로 최종 임베딩 벡터를 생성하는 최종 임베딩 벡터 생성부를 포함하되, 상기 제1 임베딩부는 제1 모델을 이용하여 상기 메타 데이터와 상기 컬럼헤딩에 대한 임베딩을 수행하고, 상기 제2 임베딩부는 상기 제1 모델과는 상이한 제2 모델을 이용하여 상기 레코드에 대한 임베딩을 수행할 수 있다.
Int. CL G06F 16/28 (2019.01.01) G06F 16/22 (2019.01.01) G06F 16/33 (2019.01.01) G06N 20/00 (2019.01.01)
CPC G06F 16/284(2013.01) G06F 16/221(2013.01) G06F 16/3347(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020220120512 (2022.09.23)
출원인 서울시립대학교 산학협력단
등록번호/일자 10-2526055-0000 (2023.04.21)
공개번호/일자
공고번호/일자 (20230426) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.09.23)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김한준 서울특별시 서초구
2 윤종찬 경기도 성남시 분당구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 카이특허법인 대한민국 서울특별시 강남구 논현로**길 **, *층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 서울특별시 동대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [우선심사신청]심사청구서·우선심사신청서
2022.09.23 수리 (Accepted) 1-1-2022-1003142-76
2 [특허출원]특허출원서
[Patent Application] Patent Application
2022.09.23 수리 (Accepted) 1-1-2022-1002821-91
3 공지예외적용주장 증명서류 제출기한 안내문
2022.09.28 발송처리완료 (Completion of Transmission) 1-5-2022-0144749-56
4 [공지예외적용 보완 증명서류]서류제출서
2022.10.20 수리 (Accepted) 1-1-2022-1105696-17
5 의견제출통지서
Notification of reason for refusal
2022.12.12 발송처리완료 (Completion of Transmission) 9-5-2022-0967196-97
6 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.02.06 수리 (Accepted) 1-1-2023-0137370-33
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.02.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0137344-56
8 등록결정서
Decision to grant
2023.04.20 발송처리완료 (Completion of Transmission) 9-5-2023-0366568-27
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
각 컬럼의 명칭에 대한 컬럼헤딩 및 상기 각 컬럼의 셀들의 데이터 집합인 레코드를 포함하는 관계형 테이블과, 상기 관계형 테이블의 메타 데이터에 대한 임베딩 장치에 있어서,상기 메타 데이터에 대한 임베딩을 수행하여 메타 데이터 임베딩 벡터를 생성하고, 상기 컬럼헤딩에 대한 임베딩을 수행하여 컬럼헤딩 임베딩 벡터를 생성하는 제1 임베딩부;상기 레코드에 포함된 복수의 행(row) 중 어느 하나의 행의 셀 값들을 서로 연결하여, 토큰화된 자연어 문장으로 변형하는 전처리부;상기 전처리부의 전처리 결과를 기초로 상기 레코드에 대한 임베딩을 수행하여 레코드 임베딩 벡터를 생성하는 제2 임베딩부;상기 메타 데이터 임베딩 벡터, 컬럼헤딩 임베딩 벡터 및 상기 레코드 임베딩 벡터를 기초로 최종 임베딩 벡터를 생성하는 최종 임베딩 벡터 생성부;복수의 상기 관계형 테이블에 대하여 생성된 각각의 상기 최종 임베딩 벡터 간 코사인 유사도에 기초하여, 상기 복수의 관계형 테이블 중에서 데이터셋 융합 후보를 결정하는 융합 데이터 결정부; 및상기 결정된 데이터셋 융합 후보를 기초로 최종 융합 데이터셋을 결정하고, 상기 결정된 융합 데이터셋에 포함된 데이터셋 간의 공통 특징을 추출하고, 추출된 공통 특징을 기초로 추천 데이터를 생성하는 융합 데이터 활용부를 포함하되,상기 제1 임베딩부는 제1 모델을 이용하여 상기 메타 데이터와 상기 컬럼헤딩에 대한 임베딩을 수행하고, 상기 제2 임베딩부는 상기 제1 모델과는 상이한 제2 모델을 이용하여 상기 레코드에 대한 임베딩을 수행하되,상기 메타 데이터는 상기 관계형 테이블에 대한 키워드 태그 데이터를 포함하고, 상기 키워드 태그 데이터는 상기 관계형 테이블에 태깅된 키워드에 관한 정보를 포함하며,상기 최종 임베딩 벡터 생성부는, 상기 메타 데이터 임베딩 벡터에 대하여 제1 가중치를 부여하고, 상기 컬럼헤딩 임베딩 벡터에 대하여 제2 가중치를 부여하고, 상기 레코드 임베딩 벡터에 대하여 제3 가중치를 부여하고, 상기 메타 데이터 임베딩 벡터, 상기 컬럼헤딩 임베딩 벡터 및 상기 레코드 임베딩 벡터의 가중합에 기초하여 상기 최종 임베딩 벡터를 생성하되, 상기 제1 가중치와 상기 제2 가중치는 서로 동일한 값을 갖고, 상기 제1 가중치와 상기 제2 가중치는 상기 제3 가중치보다 작은 값을 갖는 임베딩 장치
2 2
제1 항에 있어서, 상기 메타 데이터는, 상기 관계형 테이블의 데이터 출처, 카테고리, 용량 및 작성 일자 중 적어도 하나를 더 포함하는 임베딩 장치
3 3
제1 항에 있어서, 상기 제1 모델은 Word2Vec 모델이고, 상기 제2 모델은 BERT 모델인 임베딩 장치
4 4
삭제
5 5
제3 항에 있어서, 상기 BERT 모델은, 멀티헤드 셀프어텐션 모델(multi-head self-attention model)을 포함하고,상기 제2 임베딩부는, 상기 멀티헤드 셀프어텐션 모델을 이용하여 상기 레코드에 대한 임베딩을 수행하는 임베딩 장치
6 6
제5 항에 있어서, 상기 멀티헤드 셀프어텐션 모델은, 단어 조각 임베딩 벡터(Word Piece Embedding Vector)를 입력값으로 하여 상기 레코드에 대한 임베딩을 수행하는 임베딩 장치
7 7
삭제
8 8
삭제
9 9
각 컬럼의 명칭에 대한 컬럼헤딩 및 상기 각 컬럼의 셀들의 데이터 집합인 레코드를 포함하는 관계형 테이블에 대한 임베딩과, 상기 관계형 테이블의 메타 데이터에 대한 임베딩을 수행하는 임베딩 장치에 의해 수행되는 임베딩 방법에 있어서,상기 메타 데이터에 대한 임베딩을 수행하여 메타 데이터 임베딩 벡터를 생성하고, 상기 컬럼헤딩에 대한 임베딩을 수행하여 컬럼헤딩 임베딩 벡터를 생성하는 단계;상기 레코드에 포함된 복수의 행(row) 중 어느 하나의 행의 셀 값들을 서로 연결하여, 토큰화된 자연어 문장으로 변형하는 전처리 단계;상기 전처리 단계의 전처리 결과를 기초로 상기 레코드에 대한 임베딩을 수행하여 레코드 임베딩 벡터를 생성하는 단계; 상기 메타 데이터 임베딩 벡터, 컬럼헤딩 임베딩 벡터 및 상기 레코드 임베딩 벡터를 기초로 최종 임베딩 벡터를 생성하는 단계;복수의 상기 관계형 테이블에 대하여 생성된 각각의 상기 최종 임베딩 벡터 간 코사인 유사도에 기초하여, 상기 복수의 관계형 테이블 중에서 데이터셋 융합 후보를 결정하는 단계; 및상기 결정된 데이터셋 융합 후보를 기초로 최종 융합 데이터셋을 결정하고, 상기 결정된 융합 데이터셋에 포함된 데이터셋 간의 공통 특징을 추출하고, 추출된 공통 특징을 기초로 추천 데이터를 생성하는 단계를 포함하되,상기 메타 데이터 임베딩 벡터와 컬럼헤딩 임베딩 벡터를 생성하는 단계는, 제1 모델을 이용하여 상기 메타 데이터와 상기 컬럼헤딩에 대한 임베딩을 수행하고, 상기 레코드 임베딩 벡터를 생성하는 단계는, 상기 제1 모델과는 상이한 제2 모델을 이용하여 상기 레코드에 대한 임베딩을 수행하며,상기 메타 데이터는 상기 관계형 테이블에 대한 키워드 태그 데이터를 포함하고, 상기 키워드 태그 데이터는 상기 관계형 테이블에 태깅된 키워드에 관한 정보를 포함하며,상기 최종 임베딩 벡터를 생성하는 단계는, 상기 메타 데이터 임베딩 벡터에 대하여 제1 가중치를 부여하고, 상기 컬럼헤딩 임베딩 벡터에 대하여 제2 가중치를 부여하고, 상기 레코드 임베딩 벡터에 대하여 제3 가중치를 부여하고, 상기 메타 데이터 임베딩 벡터, 상기 컬럼헤딩 임베딩 벡터 및 상기 레코드 임베딩 벡터의 가중합에 기초하여 상기 최종 임베딩 벡터를 생성하되, 상기 제1 가중치와 상기 제2 가중치는 서로 동일한 값을 갖고, 상기 제1 가중치와 상기 제2 가중치는 상기 제3 가중치보다 작은 값을 갖는 임베딩 방법
10 10
제9 항에 있어서, 상기 제1 모델은 Word2Vec 모델이고, 상기 제2 모델은 BERT 모델인 임베딩 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서울시립대학교 개인기초연구(과기정통부) 정형 테이블 데이터셋에 대한 딥러닝 기반 데이터 융합 기술 개발