맞춤기술찾기

이전대상기술

비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템 및 방법

  • 기술번호 : KST2021004950
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 비정형 질문 또는 요구 발화의 구조화된 패러프레이징(structured-paraphrasing) 시스템 및 방법에 관한 것으로서, 보다 구체적으로는 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템으로서, 질문 또는 요구 문장과 상기 문장의 논항(argument)이 한 쌍으로 병기된 병렬 코퍼스(parallel corpus)를 학습 입력 데이터로 수집하는 데이터 수집부; 상기 데이터 수집부에서 수집된 병렬 코퍼스의 질문 또는 요구 문장과 논항의 연관성 및 의미(semantic) 관계를 이해하도록 패러프레이징 모델을 학습하는 학습부; 및 사용자로부터 질문 또는 요구 발화가 입력되면, 상기 학습된 패러프레이징 모델을 이용하여, 입력된 질문 또는 요구 문장을 분류 및 분석하고, core content로서 논항을 추출하는 패러프레이징부를 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템 및 방법에 따르면, 종래의 질의응답(question answering) 또는 대화 시스템 기술과는 입력과 출력의 형태 자체에서 큰 차이를 가지는바, 대상으로 하는 입력 자체가 기존 시스템에서 다루는 정형된 질문 또는 요구 문장에서 발전하여, 대화체의 비정형 문장이나 일상 회화에서 나올 수 있는 표현들까지도 포함하여 적용될 수 있으며, 입력 문장을 구조화하는 방식도 기존 시스템에서 자주 관찰되는 structured table 형태와는 달리, 일종의 정형화된 자연어의 형태를 지니도록 입력된 자연어에 대해 core content를 추출하는 structured paraphrasing을 수행함으로써, 인간이 질문 및 요구를 이해하는 방식으로 입력된 비정형 문장을 처리할 수 있다. 또한, 본 발명에서 제안하고 있는 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템 및 방법에 따르면, 입력되는 질문 또는 요구 문장의 종류에 따라 yes/no question, alternative question, wh-question, prohibition, requirement, strong requirement의 여섯 가지 유형 중 어느 하나의 유형으로 분류하여, 분류된 문장을 character 단위로 분석하고 core content를 추출함으로써, 비정형 질문 또는 요구 문장을 빠짐없이 다룰 수 있으며, 문장 내 지우거나 변환해야 할 부분을 시스템 스스로가 학습하는 과정에서 출력의 정확도를 높일 수 있다. 뿐만 아니라, 본 발명에서 제안하고 있는 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템 및 방법에 따르면, 두 개의 RNN(Recurrent Neural Network, 순환 신경망)으로 구성된 seq2seq 모델(시퀀스-투-시퀀스 모델, 인코더-디코더 모델)을 사용함으로써, 기존의 규칙기반 시스템과는 달리 다양한 문장에 대해서 출력 값 도출이 가능하여 한국어의 다양한 표현에 대해서도 유연하게 대응할 수 있으며, 학습되어 있지 않은 문장에 대해서도 시스템 자체적으로 추론하여 구조화된 패러프레이징을 할 수 있다.
Int. CL G06F 40/20 (2020.01.01) G06F 40/40 (2020.01.01) G06F 16/332 (2019.01.01) G06N 3/08 (2006.01.01)
CPC G06F 40/205(2013.01) G06F 40/40(2013.01) G06F 16/3329(2013.01) G06N 3/08(2013.01)
출원번호/일자 1020190134120 (2019.10.25)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2021-0049613 (2021.05.06) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.10.25)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남수 서울특별시 서초구
2 조원익 서울특별시 광진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울특별시 금천구 가산디지털*로 ***, 에이동 ***호 특허그룹덕원 (가산동, 우림 라이온스밸리)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.10.25 수리 (Accepted) 1-1-2019-1095624-67
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
3 선행기술조사의뢰서
Request for Prior Art Search
2021.02.18 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
비정형 질문 또는 요구 발화의 구조화된 패러프레이징(structured-paraphrasing) 시스템(10)으로서,질문 또는 요구 문장과 상기 문장의 논항(argument)이 한 쌍으로 병기된 병렬 코퍼스(parallel corpus)를 학습 입력 데이터로 수집하는 데이터 수집부(100);상기 데이터 수집부(100)에서 수집된 병렬 코퍼스의 질문 또는 요구 문장과 논항의 연관성 및 의미(semantic) 관계를 이해하도록 패러프레이징 모델을 학습하는 학습부(200); 및사용자로부터 질문 또는 요구 발화가 입력되면, 상기 학습된 패러프레이징 모델을 이용하여, 입력된 질문 또는 요구 문장을 분류 및 분석하고, core content로서 논항을 추출하는 패러프레이징부(300)를 포함하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
2 2
제1항에 있어서, 상기 데이터 수집부(100)는,상기 병렬 코퍼스의 질문 또는 요구 문장의 종류에 따라 yes/no question, alternative question, wh-question, prohibition, requirement, strong requirement의 여섯 가지 유형으로 나뉘어 수집하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
3 3
제2항에 있어서, 상기 패러프레이징부(300)는,사용자로부터 입력된 상기 질문 또는 요구 문장을 character 단위로 분석하여, 문장 내 지우거나 변환해야 할 부분을 판단하는 분석부(310); 및상기 분석부(310)에서의 판단에 따라 상기 질문 또는 요구 문장의 core content로서 논항을 추출하는 추출부(320)를 포함하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
4 4
제3항에 있어서, 상기 분석부(310)는,사용자로부터 입력된 상기 질문 또는 요구 문장의 종류에 따라 yes/no question, alternative question, wh-question, prohibition, requirement, strong requirement의 여섯 가지 유형 중 어느 하나의 유형으로 분류하여, 분류된 문장을 character 단위로 분석하고, 문장 내 지우거나 변환해야 할 부분을 판단하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
5 5
제1항에 있어서, 상기 패러프레이징 모델은,seq2seq 모델(시퀀스-투-시퀀스 모델, 인코더-디코더 모델)을 사용하여 상기 입력된 문장을 분석하고, 논항을 추출하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
6 6
제5항에 있어서, 상기 seq2seq 모델은,두 개의 RNN(Recurrent Neural Network, 순환 신경망)으로 구성되며, RNN encoder-decoder with Attention 또는 Transformer 접근 방식을 이용하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 시스템(10)
7 7
비정형 질문 또는 요구 발화의 구조화된 패러프레이징(structured-paraphrasing) 방법으로서,(1) 데이터 수집부(100)가, 질문 또는 요구 문장과 상기 문장의 논항(argument)이 한 쌍으로 병기된 병렬 코퍼스(parallel corpus)를 학습 입력 데이터로 수집하는 단계;(2) 학습부(200)가, 상기 단계 (1)에서 수집된 병렬 코퍼스의 질문 또는 요구 문장과 논항의 연관성 및 의미(semantic) 관계를 이해하도록 패러프레이징 모델을 학습하는 단계; 및(3) 사용자로부터 질문 또는 요구 발화가 입력되면, 상기 단계 (2)에서 학습된 패러프레이징 모델을 이용하여, 패러프레이징부(300)가, 입력된 질문 또는 요구 문장을 분류 및 분석하고, core content로서 논항을 추출하는 단계를 포함하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 방법
8 8
제7항에 있어서, 상기 단계 (1)에서는,상기 병렬 코퍼스의 질문 또는 요구 문장의 종류에 따라 yes/no question, alternative question, wh-question, prohibition, requirement, strong requirement의 여섯 가지 유형으로 나뉘어 수집하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 방법
9 9
제8항에 있어서, 상기 단계 (3)은,(3-1) 분석부(310)가, 사용자로부터 입력된 상기 질문 또는 요구 문장을 character 단위로 분석하여, 문장 내 지우거나 변환해야 할 부분을 판단하는 단계; 및(3-2) 추출부(320)가, 상기 단계 (3-1)에서의 판단에 따라 상기 질문 또는 요구 문장의 core content로서 논항을 추출하는 단계를 포함하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 방법
10 10
제9항에 있어서, 상기 단계 (3-1)에서는,사용자로부터 입력된 상기 질문 또는 요구 문장의 종류에 따라 yes/no question, alternative question, wh-question, prohibition, requirement, strong requirement의 여섯 가지 유형 중 어느 하나의 유형으로 분류하여, 분류된 문장을 character 단위로 분석하고, 문장 내 지우거나 변환해야 할 부분을 판단하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 방법
11 11
제7항에 있어서, 상기 패러프레이징 모델은,seq2seq 모델(시퀀스-투-시퀀스 모델, 인코더-디코더 모델)을 사용하되,상기 seq2seq 모델은, 두 개의 RNN(Recurrent Neural Network, 순환 신경망)으로 구성되며, RNN encoder-decoder with Attention 또는 Transformer 접근 방식을 이용하는 것을 특징으로 하는, 비정형 질문 또는 요구 발화의 구조화된 패러프레이징 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한양대학교산학협력단 인공지능융합로봇시스템기술 로봇용 free-running 임베디드 자연어 대화음성인식을 위한 원천 기술 개발