맞춤기술찾기

이전대상기술

정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템 및 방법

  • 기술번호 : KST2022007703
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 기계가 주어진 지문과 질문을 이해하여 지문 내에서 답변 영역을 평문뿐만 아니라 표, 리스트와 같이 일정한 형식을 갖춘 데이터에서 찾아 효율적인 대응이 가능하도록 한 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템 및 방법에 관한 것으로, 표 데이터에 특화된 언어모형 구축을 위한 사전 학습을 하는 사전 학습부;구축된 테이블 특화 언어 모형으로 기계독해 데이터에 대해 학습하는 미세 조정 학습부;미세조정 학습된 테이블 특화 기계독해 모형에 테이블과 사용자의 질문을 입력하고 질문에 대한 답을 출력하는 정답 추론부;를 포함하는 것이다.
Int. CL G06F 16/332 (2019.01.01) G06F 40/30 (2020.01.01) G06F 40/177 (2020.01.01) G06F 40/279 (2020.01.01) G06N 3/08 (2006.01.01)
CPC
출원번호/일자 1020210067844 (2021.05.26)
출원인 부산대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0074695 (2022.06.03) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200162681   |   2020.11.27
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.05.26)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 부산대학교 산학협력단 대한민국 부산광역시 금정구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권혁철 부산광역시 금정구
2 이정훈 부산광역시 금정구
3 조상현 부산광역시 금정구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 오위환 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2 정기택 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
3 나성곤 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.05.26 수리 (Accepted) 1-1-2021-0608768-46
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
표 데이터에 특화된 언어모형 구축을 위한 사전 학습을 하는 사전 학습부;구축된 테이블 특화 언어 모형으로 기계독해 데이터에 대해 학습하는 미세 조정 학습부;미세조정 학습된 테이블 특화 기계독해 모형에 테이블과 사용자의 질문을 입력하고 질문에 대한 답을 출력하는 정답 추론부;를 포함하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
2 2
제 1 항에 있어서, 사전 학습부는,사전학습을 위한 표 데이터를 입력하는 입력부와,입력부를 통한 입력 데이터 중 정형 데이터인 표 데이터를 사전학습 모형에 넣기 편한 형태인 평면 상태를 만들어주는 표 데이터 평면화 정제부와,표 데이터를 위해 특화된 임베딩을 수행하는 표 데이터 특화 임베딩 적용부와, 표 데이터 특화 임베딩 적용부에서 출력된 표현 값을 입력받아 행과 열의 표현 벡터를 구하여 토큰 표현 벡터에 합산하는 셀 표현 연산부와,표 데이터 특화 임베딩 적용부에서 생성된 임베딩 벡터를 기반으로 표 특화 언어 모형을 학습하는 학습부를 포함하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
3 3
제 2 항에 있어서, 표 데이터 특화 임베딩 적용부는,표에 특화된 질의응답 사전학습 언어모형을 만들기 위해서 비정형 또는 반정형 데이터에 표와 같은 셀의 행, 열 번호와 순위 정보, 개체명(named entity)정보의 임베딩을 수행하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
4 4
제 3 항에 있어서, 표 데이터에 특화된 임베딩은 숫자, 수량, 시간의 대소 비교가 가능한 표 데이터를 행의 방향으로 순위를 매기고 해당 순위에 대한 임베딩을 부여하는 순위 임베딩과,표 데이터의 각 셀의 숫자, 수량, 시간, 국가, 인물 이름에 대한 개체명을 분류하고 해당 개체명에 대한 임베딩을 부여하는 개체명 임베딩이 포함되는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
5 5
제 2 항에 있어서, 셀 표현 연산부는,평문 언어 모형에서 출력된 표현 값을 셀 단위의 표현 값으로 치환하고 표의 셀 정보가 반영된 표현 값을 생성하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
6 6
제 2 항에 있어서, 학습부는, 표 데이터에 적합한 언어 모형을 생성하기 위해 마스킹 언어 모형을 이용하여 표 데이터에 대한 사전학습을 하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
7 7
제 6 항에 있어서, 마스킹 언어 모형은 사전학습을 위해 입력된 데이터의 일부를 마스킹하고 마스킹된 문장을 입력받았을 때 마스킹 되기 전의 토큰을 예측하도록 하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
8 8
제 1 항에 있어서, 정답 추론부는,질의와 질의에 대한 정답을 찾기 위한 표 데이터를 입력하는 질의 입력부와, 질의 입력부를 통해 입력된 데이터 중 정형 데이터인 표 데이터를 사전학습 모형에 넣기 편한 형태인 평면 상태를 만들어주는 표 데이터 평면화 정제부와,사전학습된 표 데이터 특화 언어모형에 평면화된 질문과 테이블을 입력하고 입력 토큰들의 표현 백터를 출력받는 표 데이터 특화 사전학습 언어모형 출력부와,언어모형에서 출력된 표현 벡터를 이용하여 정답의 시작과 끝을 예측하고 답을 출력하는 응답 출력부를 포함하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
9 9
제 8 항에 있어서, 응답 출력부는,사전학습된 표 데이터 특화 언어모형에 표 데이터와 질문을 입력하고 입력된 표에서 질문에 대한 정답의 범위를 찾는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 시스템
10 10
사전 학습부에서 표 데이터에 특화된 언어모형 구축을 위한 사전학습을 수행하는 단계;미세 조정 학습부에서 구축된 테이블 특화 언어 모형으로 기계독해 데이터에 대해 학습하는 미세 조정 학습을 수행하는 단계;정답 추론부에서 미세조정 학습된 테이블 특화 기계독해 모형에 테이블과 사용자의 질문을 입력하고 질문에 대한 답을 출력하는 정답 추론 단계;를 포함하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
11 11
제 10 항에 있어서, 사전학습을 수행하는 단계에서,사전 학습부의 표 데이터 평면화 정체부에서 반-구조화된 표 데이터를 언어 모형에 입력할 수 있는 평면화된 토큰의 배열 형태로 변환하고,사전 학습부의 표 데이터 특화 임베딩 적용부가 표 데이터 평면화 정체부에서 생성된 표 데이터에 대해서 표 데이터에 특화된 임베딩을 생성하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
12 12
제 11 항에 있어서, 표 데이터에 특화된 임베딩은,숫자, 수량, 시간의 대소 비교가 가능한 표 데이터를 행의 방향으로 순위를 매기고 해당 순위에 대한 임베딩을 부여하는 순위 임베딩과,표 데이터의 각 셀의 숫자, 수량, 시간, 국가, 인물 이름에 대한 개체명을 분류하고 해당 개체명에 대한 임베딩을 부여하는 개체명 임베딩이 포함되는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
13 13
제 10 항에 있어서, 사전학습을 수행하는 단계에서,사전 학습부의 학습부에서 표 데이터에 적합한 언어 모형을 생성하기 위해 마스킹 언어 모형을 이용하여 표 데이터에 대한 사전학습을 하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
14 14
제 13 항에 있어서, 마스킹 언어 모형은 사전학습을 위해 입력된 데이터의 일부를 마스킹하고 마스킹된 문장을 입력받았을 때 마스킹 되기 전의 토큰을 예측하도록 하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
15 15
제 10 항에 있어서, 사전학습을 수행하는 단계에서 사전학습 언어모형의 입력은,토큰 사전에서의 입력된 토큰의 번호 Token ids, 각 토큰의 입력된 순서 Position ids, 질의와 관련된 토큰은 0을 부여하고 표와 관련된 토큰은 1을 부여하여 각 토큰의 종류를 나타내는 Segments ids 및,각 토큰이 해당하는 행과 열의 번호를 나타내는 Column ids와 Row ids, 행을 기준으로 대/소 비교가 가능한 셀들에 대해서 대소 비교를 하고 큰 순서대로 순위를 부여한 것을 나타내는 Rank ids, 개체명에 대한 번호를 나타내는 Name ids를 포함하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
16 16
제 10 항에 있어서, 정답 추론 단계의 질의응답 과정에서 정답 추론부의 표 데이터 특화 사전학습 언어모형 출력부는 사전학습한 언어모형에 표 데이터 평면화 정제부에서 정제한 질문과 표 데이터를 입력하여 입력한 각 토큰에 대한 표현값을 출력하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
17 17
제 16 항에 있어서, 정답 추론 단계의 질의응답 과정에서 표 데이터 특화 사전학습 언어모형에서 출력된 표현 값을 이용하여 정답 출력을 위한 예측 값을 출력하고,입력된 테이블에서 정답에 해당하는 토큰들의 시작 위치와 끝의 위치에 대한 확률을 출력하며, [CLS] 토큰의 표현을 이용하여 입력된 테이블에 질문에 대한 정답을 포함하고 있을 확률을 출력하는 것을 특징으로 하는 정형 및 비정형 및 반정형 정보를 사용한 표에 특화된 기계독해 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 부산대학교 산학협력단 인공지능융합선도프로젝트(R&D) 인공지능융합연구센터지원(부산대학교)