맞춤기술찾기

이전대상기술

문장 임베딩 및 유사 질문 검색을 위한 장치 및 방법

  • 기술번호 : KST2018015422
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 워드 임베딩과 격틀 기반의 문장 임베딩 기술을 이용하여 질문 검색 서비스를 개선할 수 있도록 한 문장 임베딩 및 유사 질문 검색을 위한 장치 및 방법에 관한 것으로, 사용자가 입력한 질문과 검색 대상이 되는 질문에 대해 언어 분석을 진행하여 질문에서 단어 간의 의존관계 및 문장 성분으로써의 역할을 매핑하고 문장 성분을 추출하는 질문 언어 분석 처리부;상기 질문 언어 분석 처리부에서 추출된 문장 성분을 이용하여 격틀을 생성하는 격틀 생성부;상기 격틀 생성부에서 생성된 격틀 기반의 벡터와 BOW(bag of words) 모델 기반의 벡터를 이용해 사용자 질문과 검색 대상 질문 사이의 의미 유사도를 계산하는 유사도 계산부;상기 유사도 계산부의 유사도 계산 결과를 이용하여 격틀과 워드 임베딩을 이용한 문장 성분 간의 연관성을 고려한 검색 모델(WCFM)을 구축하는 검색 모델 구축부;TRLM(Translation based Language Model)을 통해 얻어진 각 검색 결과의 유사도 및 순위와 상기 검색 모델 구축부에서 구축된 WCFM을 통해 얻어진 유사도를 모두 반영하여 재순위화를 진행하는 재순위화부;를 포함하는 것이다.
Int. CL G06F 17/30 (2006.01.01) G06F 17/27 (2006.01.01)
CPC G06F 16/332(2013.01) G06F 16/332(2013.01)
출원번호/일자 1020170060425 (2017.05.16)
출원인 동아대학교 산학협력단
등록번호/일자 10-1923650-0000 (2018.11.23)
공개번호/일자 10-2018-0125746 (2018.11.26) 문서열기
공고번호/일자 (20181129) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.05.16)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 대한민국 부산광역시 사하구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고영중 대한민국 부산광역시 해운대구
2 배경만 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 정기택 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2 오위환 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
3 나성곤 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 부산광역시 사하구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.05.16 수리 (Accepted) 1-1-2017-0463514-27
2 등록결정서
Decision to grant
2018.11.21 발송처리완료 (Completion of Transmission) 9-5-2018-0795353-07
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사용자가 입력한 질문과 검색 대상이 되는 질문에 대해 언어 분석을 진행하여 질문에서 단어 간의 의존관계 및 문장 성분으로써의 역할을 매핑하고 문장 성분을 추출하는 질문 언어 분석 처리부;상기 질문 언어 분석 처리부에서 추출된 문장 성분을 이용하여 격틀을 생성하는 격틀 생성부;상기 격틀 생성부에서 생성된 격틀 기반의 벡터와 BOW(bag of words) 모델 기반의 벡터를 이용해 사용자 질문과 검색 대상 질문 사이의 의미 유사도를 계산하는 유사도 계산부;상기 유사도 계산부의 유사도 계산 결과를 이용하여 격틀과 워드 임베딩을 이용한 문장 성분 간의 연관성을 고려한 검색 모델(WCFM)을 구축하는 검색 모델 구축부;TRLM(Translation based Language Model)을 통해 얻어진 각 검색 결과의 유사도 및 순위와 상기 검색 모델 구축부에서 구축된 WCFM을 통해 얻어진 유사도를 모두 반영하여 재순위화를 진행하는 재순위화부;를 포함하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
2 2
제 1 항에 있어서, 상기 질문 언어 분석 처리부는,사용자가 입력한 질문과 검색 대상이 되는 질문에 대해 언어 분석을 진행하는 질문 언어 분석부와,형태소 분석과 개체명 인식을 진행한 후 의존 파싱을 통해 질문에서 단어 간의 의존관계 및 문장 성분으로써의 역할을 매핑하는 역할 매핑부와,의존 파싱을 통해 각 단어의 문장 성분을 확인하여 질문에서 주요 문장 성분인 주어, 목적어, 서술어, 보어를 추출하는 문장 성분 추출부를 포함하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
3 3
제 1 항에 있어서, 상기 격틀 생성부는,질문에 대한 의존관계를 이용해 주절 및 수식어 기반의 종속절과 보어 기반의 종속절에서 각각 주어, 서술어, 목적어, 보어를 추출하여 최대 12개의 단어로 이루어진 격틀을 생성하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
4 4
제 1 항에 있어서, 상기 유사도 계산부는,각 단어와 매칭이 되는 워드 임베딩 기반 자질 벡터를 이용해 격틀 벡터를 생성하고, 생성된 격틀 벡터간의 코사인 유사도를 계산하여 격틀 단어 간의 단어 불일치 문제를 해결하는 동시에 학습데이터를 통해 생성된 워드 임베딩 자질 벡터를 이용하여 단어 간 의미 유사도를 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
5 5
제 4 항에 있어서, 상기 유사도 계산부에서,격틀을 구성하는 각 단어는 고정된 위치를 가지며, 같은 위치에 있는 단어 간의 연관성만을 고려하여,사용자 질문에서 생성한 격틀에 존재하는 주절의 주어는 검색 대상 질문에서 생성한 격틀에 존재하는 주절의 주어하고만 의미 연관성을 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
6 6
제 4 항에 있어서, 상기 유사도 계산부에서,각 벡터의 가중치(weight)는 바이너리 값을 사용하고, 각 벡터 간 코사인 유사도를 계산하고, 선형 결합을 통해 최종 질문 간 의미 유사도를 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
7 7
제 1 항에 있어서, 상기 검색 모델 구축부는,격틀을 구성하는 각 단어와 매칭이 되는 워드 임베딩 기반의 자질 벡터를 매핑하여 새로운 벡터를 구성하여 격틀과 워드 임베딩을 이용한 문장 성분 간의 연관성을 고려한 검색 모델(WCFM) 구축하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 장치
8 8
사용자가 입력한 질문과 검색 대상이 되는 질문에 대해 언어 분석을 진행하여 질문에서 단어 간의 의존관계 및 문장 성분으로써의 역할을 매핑하고 문장 성분을 추출하는 질문 언어 분석 처리 단계;상기 질문 언어 분석 처리 단계에서 추출된 문장 성분을 이용하여 격틀을 생성하는 격틀 생성 단계;상기 격틀 생성 단계에서 생성된 격틀 기반의 벡터와 BOW(bag of words) 모델 기반의 벡터를 이용해 사용자 질문과 검색 대상 질문 사이의 의미 유사도를 계산하는 유사도 계산 단계;상기 유사도 계산 단계의 유사도 계산 결과를 이용하여 격틀과 워드 임베딩을 이용한 문장 성분 간의 연관성을 고려한 검색 모델(WCFM)을 구축하는 검색 모델 구축 단계;TRLM(Translation based Language Model)을 통해 얻어진 각 검색 결과의 유사도 및 순위와 상기 구축된 WCFM을 통해 얻어진 유사도를 모두 반영하여 재순위화를 진행하는 재순위화 단계;를 포함하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
9 9
제 8 항에 있어서, 상기 질문 언어 분석 처리 단계는,사용자가 입력한 질문과 검색 대상이 되는 질문에 대해 언어 분석을 진행하는 질문 언어 분석 단계와,형태소 분석과 개체명 인식을 진행한 후 의존 파싱을 통해 질문에서 단어 간의 의존관계 및 문장 성분으로써의 역할을 매핑하는 역할 매핑 단계와,의존 파싱을 통해 각 단어의 문장 성분을 확인하여 질문에서 주요 문장 성분인 주어, 목적어, 서술어, 보어를 추출하는 문장 성분 추출 단계를 포함하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
10 10
제 8 항에 있어서, 상기 격틀 생성 단계는,질문에 대한 의존관계를 이용해 주절 및 수식어 기반의 종속절과 보어 기반의 종속절에서 각각 주어, 서술어, 목적어, 보어를 추출하여 최대 12개의 단어로 이루어진 격틀을 생성하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
11 11
제 8 항에 있어서, 상기 유사도 계산 단계는,각 단어와 매칭이 되는 워드 임베딩 기반 자질 벡터를 이용해 격틀 벡터를 생성하고, 생성된 격틀 벡터간의 코사인 유사도를 계산하여 격틀 단어 간의 단어 불일치 문제를 해결하는 동시에 학습데이터를 통해 생성된 워드 임베딩 자질 벡터를 이용하여 단어 간 의미 유사도를 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
12 12
제 11 항에 있어서, 상기 유사도 계산 단계에서,격틀을 구성하는 각 단어는 고정된 위치를 가지며, 같은 위치에 있는 단어 간의 연관성만을 고려하여,사용자 질문에서 생성한 격틀에 존재하는 주절의 주어는 검색 대상 질문에서 생성한 격틀에 존재하는 주절의 주어하고만 의미 연관성을 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
13 13
제 11 항에 있어서, 상기 유사도 계산 단계에서,각 벡터의 가중치(weight)는 바이너리 값을 사용하고, 각 벡터 간 코사인 유사도를 계산하고, 선형 결합을 통해 최종 질문 간 의미 유사도를 계산하는 것을 특징으로 하는 문장 임베딩 및 유사 질문 검색을 위한 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 동아대학교 이공학개인기초연구지원 딥러닝 기술을 이용한 커뮤니티 질문-응답 서비스 기반의 질문 분류, 검색 및 응답 추천 시스템 구축