맞춤기술찾기

이전대상기술

트리플 데이터의 생성 방법 및 시스템(Generating method and system for triple data)

  • 기술번호 : KST2017012696
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 트리플 데이터의 생성 방법 및 시스템에 관한 것으로, 보다 구체적으로는 자연어 문장 내 주어 및 목적어를 포함하는 트리플 데이터로 구성된 지식 베이스와 코퍼스(corpus)를 입력받고, 이에 기초하여 패턴을 생성하는 패턴생성부; 생성된 패턴 중 상기 주어와 목적어 간에 관계를 나타내는 어휘별 패턴 후보를 추출하여 학습하는 패턴학습부; 및 학습된 패턴에 기초하여 신규 트리플 데이터를 생성하는 트리플 생성부;를 포함하되, 상기 패턴은 상기 자연어 문장 내 존재하는 주어 조사, 목적어 조사 및 서술어를 포함하거나, 상기 자연어 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘를 나타내는 것을 특징으로 한다. 본 발명의 일 측면에 따르면, 시맨틱 웹(semantic web) 분야에서 자연어로 표현된 문서의 데이터를 용이하고 신속하게 구조화하여, 컴퓨터의 데이터 처리 속도를 향상시킬 수 있는 효과가 있다. 본 발명의 다른 측면에 따르면, 한국어 데이터를 구조화시킬 수 있어, 한국어 사용자의 만족도를 향상시킬 수 있는 효과가 있다.
Int. CL G06F 17/30 (2016.03.11) G06F 17/27 (2016.03.11)
CPC G06F 16/36(2013.01) G06F 16/36(2013.01) G06F 16/36(2013.01) G06F 16/36(2013.01)
출원번호/일자 1020160009168 (2016.01.26)
출원인 경북대학교 산학협력단
등록번호/일자
공개번호/일자 10-2017-0089142 (2017.08.03) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.01.26)
심사청구항수 22

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 경북대학교 산학협력단 대한민국 대구광역시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박세영 대한민국 대구광역시 북구
2 박성배 대한민국 대구광역시 북구
3 윤희근 대한민국 대구광역시 달성군 다사읍 매곡
4 최수정 대한민국 대구광역시 달서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤귀상 대한민국 서울특별시 금천구 디지털로*길 ** ***호 (가산동, 한신IT타워*차)(디앤특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 경북대학교 산학협력단 대구광역시 북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.01.26 수리 (Accepted) 1-1-2016-0083846-22
2 의견제출통지서
Notification of reason for refusal
2017.01.19 발송처리완료 (Completion of Transmission) 9-5-2017-0050326-11
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.03.20 수리 (Accepted) 1-1-2017-0270979-62
4 등록결정서
Decision to grant
2017.07.31 발송처리완료 (Completion of Transmission) 9-5-2017-0535072-17
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2018.03.26 수리 (Accepted) 4-1-2018-5051994-32
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.23 수리 (Accepted) 4-1-2020-5136893-04
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
대용량 데이터의 구조화에 사용되는 트리플 데이터의 생성 방법에 있어서,패턴 생성부가 자연어 문장 내 주어 및 목적어를 포함하는 트리플 데이터로 구성된 지식 베이스와 코퍼스(corpus)를 입력받고, 이에 기초하여 패턴을 생성하는 단계;패턴 학습부가 생성된 패턴 중 상기 주어와 목적어 간에 관계를 나타내는 어휘별 패턴 후보를 추출하여 학습하는 단계; 및트리플 생성부가 학습된 패턴에 기초하여 신규 트리플 데이터를 생성하는 단계;를 포함하되, 상기 패턴은 상기 자연어 문장 내 존재하는 주어 조사, 목적어 조사 및 서술어를 포함하거나, 상기 자연어 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘를 나타내는 것을 특징으로 하는 트리플 데이터의 생성 방법
2 2
제1항에 있어서,상기 패턴 생성부가 자연어 문장 내 주어 및 목적어를 포함하는 트리플 데이터로 구성된 지식 베이스와 코퍼스(corpus)를 입력받고, 이에 기초하여 패턴을 생성하는 단계는상기 자연어 문장 내 주어 및 목적어를 포함하는 트리플 데이터로 구성된 지식 베이스와 코퍼스를 입력받는 단계;상기 지식 베이스와 코퍼스로부터 주어 및 목적어를 포함하는 적어도 하나의 문장을 추출하는 단계; 추출한 문장 내 주어 또는 목적어를 각각 포함하는 적어도 하나의 어절을 추출하는 단계;추출한 어절 내 존재하는 조사 정보에 기초하여 주어 조사 및 목적어 조사를 각각 추출하는 단계;상기 추출한 문장 내 존재하는 서술어를 추출하는 단계; 및추출한 상기 주어 조사, 목적어 조사 및 서술어를 포함하는 패턴을 생성하거나, 또는 상기 추출한 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘를 추출하여 패턴으로 생성하는 단계;를 포함하는 것을 특징으로 하는 트리플 데이터의 생성 방법
3 3
제2항에 있어서,상기 추출한 문장 내 존재하는 서술어를 추출하는 단계는 상기 추출한 문장 내 서술어가 복수 개 존재하는 경우, 추출한 주어 조사에 해당하는 주어와, 상기 목적어 조사에 해당하는 목적어간에 관계를 나타내는 서술어를 추출하는 것을 특징으로 하는 트리플 데이터의 생성 방법
4 4
제3항에 있어서,상기 추출한 문장 내 존재하는 서술어를 추출하는 단계는 상기 주어 조사에 해당하는 주어와, 상기 목적어 조사에 해당하는 목적어간에 의존 관계를 분석하고, 그 분석결과에 따라 서술어를 추출하는 것을 특징으로 하는 트리플 데이터의 생성 방법
5 5
제4항에 있어서, 상기 추출한 문장 내 존재하는 서술어를 추출하는 단계는 상기 주어와 목적어간 의존 관계 정보에 기초하여 의존 관계 트리 구조를 생성하고, 생성한 의존 관계 트리 구조 내 존재하는 복수 개의 서술어 노드 중 상기 주어와 목적어에 각각 해당하는 주어 노드 및 목적어 노드와 가장 가까운 곳에 위치하는 하나의 서술어 노드를 선택한 후, 선택한 서술어 노드에 해당하는 서술어를 추출하는 것을 특징으로 하는 트리플 데이터의 생성 방법
6 6
제5항에 있어서, 상기 트리플 생성부가 학습된 패턴에 기초하여 신규 트리플 데이터를 생성하는 단계는상기 주어와 목적어간 의존 관계 정보에 기초하여 생성된 의존 관계 트리 구조 중 추출한 서술어를 기준으로 하는 부분 트리 구조를 추출하고, 추출된 부분 트리 구조 중 주어 및 목적어에 해당하는 노드를 각각 선택하여, 선택한 노드에 해당하는 주어, 목적어 및 추출한 서술어를 포함하는 신규 트리플 데이터를 생성하는 것을 특징으로 하는 트리플 데이터의 생성 방법
7 7
제1항에 있어서,상기 패턴 학습부가 생성된 패턴 중 상기 주어와 목적어 간에 관계를 나타내는 어휘별 패턴 후보를 추출하여 학습하는 단계는 학습한 패턴 후보 중 오류 패턴을 제거하는 것을 더 포함하는 것을 특징으로 하는 트리플 데이터의 생성 방법
8 8
제7항에 있어서,상기 패턴 학습부가 생성된 패턴 중 상기 주어와 목적어 간에 관계를 나타내는 어휘별 패턴 후보를 추출하여 학습하는 단계는 추출한 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘 중 상기 주어와 목적어간의 관계를 나타내는 서술어 또는 상기 문장 내 레이블, 식별자 또는 속성을 나타내는 어휘 중 적어도 하나를 프로퍼티로 생성하는 단계;상기 패턴과 프로퍼티간에 의미 유사도를 측정하는 단계; 및상기 패턴과 프로퍼티간 의미 유사도 측정결과에 기초하여 오류 패턴을 결정하고, 결정한 오류 패턴을 제거하는 단계;를 포함하는 것을 특징으로 하는 트리플 데이터의 생성 방법
9 9
제8항에 있어서,상기 패턴과 프로퍼티간에 의미 유사도를 측정하는 단계는 워드 임베딩 공간에 각각 맵핑된 상기 패턴과 프로퍼티간에 벡터 유사도를 연산하는 것을 특징으로 하는 트리플 데이터의 생성 방법
10 10
제9항에 있어서,상기 패턴과 프로퍼티간에 의미 유사도를 측정하는 단계는상기 패턴 및 프로퍼티가 서로 다른 언어로 이루어지는 경우, 상기 패턴 및 프로퍼티와 동일한 의미를 갖는 기설정된 어휘 쌍들에 기초하여 상기 패턴과 프로퍼티간 상관계수가 높아지도록 투영행렬을 학습하여 상기 패턴 및 프로퍼티를 동일한 워드 임베딩 공간으로 투영시키는 것을 더 포함하는 것을 특징으로 하는 트리플 데이터의 생성 방법
11 11
제10항에 있어서,상기 패턴은 한국어로 이루어지고, 상기 프로퍼티는 영어로 이루어지는 것을 특징으로 하는 트리플 데이터의 생성 방법
12 12
제9항에 있어서,상기 패턴과 프로퍼티간에 의미 유사도를 측정하는 단계는 상기 패턴과 프로퍼티가 각각 하나의 어휘로 이루어진 경우, 상기 패턴과 프로퍼티간에 코사인 유사도를 연산하는 것을 특징으로 하는 트리플 데이터의 생성 방법
13 13
제9항에 있어서,상기 패턴과 프로퍼티간에 의미 유사도를 측정하는 단계는 상기 패턴과 프로퍼티가 복수 개 어절 또는 복수 개의 어휘로 이루어지는 경우, 상기 패턴과 프로퍼티를 이루는 구성 요소들의 평균 벡터를 정의하고, 정의된 평균 벡터에 기초하여 상기 패턴 및 프로퍼티간에 벡터 유사도를 연산하는 것을 특징으로 하는 트리플 데이터의 생성 방법
14 14
제9항에 있어서,상기 워드 임베딩 공간은복수 개의 어휘를 N 차원(이때, 상기 N은 자연수이다
15 15
제1항에 있어서,저장부가 상기 패턴 생성부로부터 생성된 패턴과, 상기 트리플 생성부로부터 생성된 신규 트리플 데이터를 저장하는 단계;를 더 포함하는 것을 특징으로 하는 트리플 데이터의 생성 방법
16 16
제1항 내지 제15항 중 어느 한 항에 따른 방법을 컴퓨터로 실행하기 위한 프로그램이 기록된 컴퓨터 판독가능 기록매체
17 17
대용량 데이터의 구조화에 사용되는 트리플 데이터의 생성 시스템에 있어서,자연어 문장 내 주어 및 목적어를 포함하는 트리플 데이터로 구성된 지식 베이스와 코퍼스(corpus)를 입력받고, 이에 기초하여 패턴을 생성하는 패턴 생성부;생성된 패턴 중 상기 주어와 목적어 간에 관계를 나타내는 어휘별 패턴 후보를 추출하여 학습하는 패턴 학습부; 및학습된 패턴에 기초하여 신규 트리플 데이터를 생성하는 트리플 생성부;를 포함하되, 상기 패턴은 상기 자연어 문장 내 존재하는 주어 조사, 목적어 조사 및 서술어를 포함하거나, 상기 자연어 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘를 나타내는 것을 특징으로 하는 트리플 데이터의 생성 시스템
18 18
제17항에 있어서,상기 패턴 생성부는상기 주어 조사에 해당하는 주어와, 상기 목적어 조사에 해당하는 목적어간에 의존 관계를 분석하고, 그 분석결과에 따라 서술어를 추출하는 것을 특징으로 하는 트리플 데이터의 생성 시스템
19 19
제18항에 있어서,상기 패턴 생성부는 상기 주어와 목적어간 의존 관계 정보에 기초하여 의존 관계 트리 구조를 생성하고, 생성한 의존 관계 트리 구조 내 존재하는 복수 개의 서술어 노드 중 상기 주어와 목적어에 각각 해당하는 주어 노드 및 목적어 노드와 가장 가까운 곳에 위치하는 하나의 서술어 노드를 선택한 후, 선택한 서술어 노드에 해당하는 서술어를 추출하는 것을 특징으로 하는 트리플 데이터의 생성 시스템
20 20
제17항에 있어서,상기 패턴 학습부는추출한 문장 내 주어와 목적어 사이에 위치하는 적어도 하나의 어휘 중 상기 주어와 목적어간의 관계를 나타내는 서술어 또는 상기 문장 내 레이블, 식별자 또는 속성을 나타내는 어휘 중 적어도 하나를 프로퍼티로 생성하고, 상기 패턴과 프로퍼티간에 의미 유사도를 측정하며, 상기 패턴과 프로퍼티간 의미 유사도 측정결과에 기초하여 오류 패턴을 결정하고, 결정한 오류 패턴을 제거하는 것을 특징으로 하는 트리플 데이터의 생성 시스템
21 21
제19항에 있어서,상기 트리플 생성부는상기 주어와 목적어간 의존 관계 정보에 기초하여 생성된 의존 관계 트리 구조 중 추출한 서술어를 기준으로 하는 부분 트리 구조를 추출하고, 추출된 부분 트리 구조 중 주어 및 목적어에 해당하는 노드를 각각 선택하여, 선택한 노드에 각각 해당하는 주어, 목적어 및 추출한 서술어를 포함하는 신규 트리플 데이터를 생성하는 것을 특징으로 하는 트리플 데이터의 생성 시스템
22 22
제17항에 있어서,상기 패턴 생성부로부터 생성된 패턴과, 상기 트리플 생성부로부터 생성된 신규 트리플 데이터를 저장하는 저장부;를 더 포함하는 것을 특징으로 하는 트리플 데이터의 생성 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 (주)솔트룩스 정보통신방송기술개발사업 WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발