맞춤기술찾기

이전대상기술

자연어를 SQL로 변환하는 시스템을 위한 훈련 세트 수집 장치 및 그 방법

  • 기술번호 : KST2022016300
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 자연어를 SQL로 변환하는 NL2SQL 시스템을 위한 훈련 세트 수집 및 분석에 관한 것으로 본 발명에 따르면 대상 데이터베이스로부터 샘플링을 통해 발췌 테이블을 생성하고, 생성한 발췌 테이블에 대한 사용자의 자연어 질문을 SQL 쿼리로 변환하여 수행하고, 수행한 결과를 시각화 함으로써 SQL 전문가가 아니더라도 고품질의 NL2SQL 시스템 훈련 세트를 수집할 수 있도록 함으로써 비용을 절약하면서도 개발자가 오류 원인을 쉽게 분석하도록 해주는 효과가 있다.
Int. CL G06N 5/02 (2006.01.01) G06F 16/2452 (2019.01.01) G06F 16/242 (2019.01.01) G06F 16/248 (2019.01.01) G06F 16/22 (2019.01.01)
CPC G06N 5/02(2013.01) G06F 16/24522(2013.01) G06F 16/243(2013.01) G06F 16/248(2013.01) G06F 16/2228(2013.01)
출원번호/일자 1020210013642 (2021.01.29)
출원인 포항공과대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0109978 (2022.08.05) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.01.29)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 포항공과대학교 산학협력단 대한민국 경상북도 포항시 남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 한욱신 경상북도 포항시 남구
2 강혁규 경상북도 포항시 남구
3 김현지 울산광역시 동구
4 나인혁 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인이룸리온 대한민국 서울특별시 서초구 사평대로 ***, *층 (반포동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.01.29 수리 (Accepted) 1-1-2021-0123732-16
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.02.01 수리 (Accepted) 1-1-2021-0125350-25
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
주어진 데이터베이스에서 상기 데이터베이스의 일부로 구성되는 발췌 테이블(Table Excerpts)을 생성하는 테이블 생성부;상기 발췌 테이블에 대해 생성된 사용자의 자연어 질문을 NL2SQL(Natural Language to SQL) 시스템을 이용하여 SQL 쿼리로 번역하고, 상기 SQL 쿼리를 수행한 결과를 표시하는 탐색부; 및상기 SQL 쿼리를 수행한 결과 사용자에 의해 부정확한 것으로 표시된 훈련 쌍인 자연어 질문과 SQL 쿼리의 쌍을 분석하여 모델 해석(Model Interpretation), 오류 하이라이팅(Error Highlighting) 또는 시스템을 제안하는 분석부;를 포함하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
2 2
제1항에 있어서,상기 테이블 생성부는 상기 발췌 테이블을 생성하기 위해 상기 주어진 데이터베이스에서 관계 샘플링, 속성 샘플링 및 튜플 샘플링을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
3 3
제1항에 있어서,상기 탐색부에서 상기 SQL 쿼리를 수행한 결과를 저장하기 위한 히스토리 데이터베이스; 및 상기 탐색부에서 상기 SQL 쿼리를 수행한 결과 중 정확한 것으로 표시된 자연어 질문과 SQL 쿼리의 쌍을 저장하는 훈련 쌍 데이터베이스;를 더 포함하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
4 4
제1항에 있어서,상기 테이블 생성부는 상기 발췌 테이블을 교란(Perturbing)하여 새로운 발췌 테이블을 생성하고,상기 탐색부는 상기 새로운 발췌 테이블에 의해 상기 SQL 쿼리를 검증하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
5 5
제1항에 있어서,상기 분석부는 통합 그라디언트 방법과 컨덕턴스 방법에 의해 상기 부정확한 훈련 쌍을 분석하여 상기 모델 해석을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
6 6
제1항에 있어서,상기 분석부는 상기 부정확한 훈련 쌍의 SQL 쿼리와 주어진 정확한 쿼리를 질의 변환(Query Rewriting)을 사용하여 정규화하고 정규화된 두 쿼리들의 문법 구조를 비교하여 상기 부정확한 훈련 쌍의 SQL 쿼리의 잘못된 부분을 시각화 함으로써 상기 오류 하이라이팅을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
7 7
제1항에 있어서,상기 분석부는 상기 사용자의 자연어 질문을 상기 NL2SQL 시스템 외의 다른 복수의 NL2SQL 시스템을 이용하여 번역하고, 번역된 SQL 쿼리가 주어진 정확한 SQL 쿼리와 일치하는 NL2SQL 시스템을 추천하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 장치
8 8
하나 이상의 프로세서 및 메모리를 포함하는 훈련 세트 수집 장치에 의해 수행되는 훈련 세트 수집 방법에 있어서:(a) 주어진 데이터베이스에서 상기 데이터베이스의 일부로 구성되는 발췌 테이블(Table Excerpts)을 생성하는 단계;(b) 상기 발췌 테이블에 대해 생성된 사용자의 자연어 질문을 NL2SQL(Natural Language to SQL) 시스템을 이용하여 SQL 쿼리로 번역하고, 상기 SQL 쿼리를 수행한 결과를 표시하는 단계; 및(c) 상기 SQL 쿼리를 수행한 결과 사용자에 의해 부정확한 것으로 표시된 훈련 쌍인 자연어 질문과 SQL 쿼리의 쌍을 분석하여 모델 해석(Model Interpretation), 오류 하이라이팅(Error Highlighting) 또는 시스템을 제안하는 단계;를 포함하는 NL2SQL 시스템을 위한 훈련 세트 수집 방법
9 9
제8항에 있어서,상기 (a) 단계는 상기 발췌 테이블을 생성하기 위해 상기 주어진 데이터베이스에서 관계 샘플링, 속성 샘플링 및 튜플 샘플링을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
10 10
제8항에 있어서,상기 (b)단계 이후에, 상기 SQL 쿼리를 수행한 결과를 히스토리 데이터베이스에 저장하는 단계; 및 상기 SQL 쿼리를 수행한 결과 중 정확한 것으로 표시된 자연어 질문과 SQL 쿼리의 쌍을 훈련 쌍 데이터베이스에 저장하는 단계;를 더 포함하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
11 11
제8항에 있어서,상기 (a)단계는 상기 발췌 테이블을 교란(Perturbing)하여 새로운 발췌 테이블을 생성하고,상기 (b)단계는 상기 새로운 발췌 테이블에 의해 상기 SQL 쿼리를 검증하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
12 12
제8항에 있어서,상기 (c)단계는 통합 그라디언트 방법과 컨덕턴스 방법에 의해 상기 부정확한 훈련 쌍을 분석하여 상기 모델 해석을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
13 13
제8항에 있어서,상기 (c)단계는 상기 부정확한 훈련 쌍의 SQL 쿼리와 주어진 정확한 쿼리를 질의 변환(Query Rewriting)을 사용하여 정규화하고 정규화된 두 쿼리들의 문법 구조를 비교하여 상기 부정확한 훈련 쌍의 SQL 쿼리의 잘못된 부분을 시각화 함으로써 상기 오류 하이라이팅을 수행하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
14 14
제8항에 있어서,상기 (c)단계는 상기 사용자의 자연어 질문을 상기 NL2SQL 시스템 외의 다른 복수의 NL2SQL 시스템을 이용하여 번역하고, 번역된 SQL 쿼리가 주어진 정확한 SQL 쿼리와 일치하는 NL2SQL 시스템을 추천하는 것을 특징으로 하는, NL2SQL 시스템을 위한 훈련 세트 수집 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 포항공과대학교 산학협력단 SW컴퓨팅산업원천기술개발사업(SW스타랩) 대화 가능하고 자동으로 튜닝하는 DBMS의 개발