1 |
1
장치에 의해 수행되는 지식 그래프를 정제하기 위한 방법에 있어서,데이터베이스에 저장된 지식 그래프에서 식별 가능한 복수 개의 그래프 형태들을 확인하며, 토픽과 관련된 정보에 기초하여 상기 확인된 복수개의 그래프 형태들 중에서 하나의 개체를 공유하는 프레임워크들의 집합으로써, 공유되는 상기 개체가 중심이 되며, 상기 중심이 되는 개체와 상기 중심이 되는 개체에 연결된 다수개의 노드들을 포함하는 패턴인 개체 중심의 그래프 패턴을 식별하고, 상기 식별된 개체 중심의 그래프 패턴을 기준으로 패턴 매칭을 통해 상기 지식 그래프에서 상기 식별된 개체 중심의 그래프 패턴에 대응하는 엔터티 중심 그래프들을 식별하는 동작;상기 엔터티 중심 그래프들을 클러스터링하여 비어 있는 하나의 중심 노드와 상기 중심 노드에 연결되는 비어 있는 주변 노드의 집합을 포함하는 패턴의 코어 토픽 그래프들을 생성하는 동작;상기 코어 토픽 그래프들을 기초로, 상기 지식 그래프에서 상기 코어 토픽 그래프들 각각에 대응되는 토픽 그래프를 검출하고, 상기 코어 토픽 그래프들 각각과 상기 검출된 토픽 그래프간의 유사도에 따라 상기 지식 그래프에 포함된 링크의 중요도를 산출하는 동작; 및상기 산출된 중요도를 기초로 중요도가 임계 값보다 낮은 링크를 필터링하여 상기 지식 그래프를 정제하는 동작을 포함하는 지식 그래프를 정제하기 위한 방법
|
2 |
2
제 1항에 있어서, 상기 식별된 개체 중심의 그래프 패턴은,별 형태의 그래프 패턴을 포함하며,상기 별 형태의 그래프 패턴은, 중심이 되는 개체와 상기 중심이 되는 개체와 연결되는 복수의 프리디케이트들(predicates) 및 상기 복수의 프리디케이트들 각각에 연결되는 리프(leaf)를 포함하는 지식 그래프를 정제하기 위한 방법
|
3 |
3
제 1항에 있어서, TF-IDF(term frequency-inverse document frequency)를 기초로, 상기 엔터티 중심 그래프들에 포함된 링크들의 중요도를 산출하는 동작;상기 산출된 중요도를 기초로, 상기 엔터티 중심 그래프들에 포함된 임계 값 이하의 중요도를 갖는 링크들을 제거하여, 상기 엔터티 중심 그래프들을 축소시키는 동작을 더 포함하는 지식 그래프를 정제하기 위한 방법
|
4 |
4
제 3항에 있어서, 상기 엔터티 중심 그래프들을 클러스터링하여 상기 코어 토픽 그래프들을 생성하는 동작은,상기 축소된 엔터티 중심 그래프들 간의 상기 TF-IDF의 유사도를 계산하여 유사도 매트릭스를 생성하는 동작;상기 생성된 유사도 매트릭스를 입력 값으로 하여, 상기 축소된 엔터티 중심 그래프들에 대한 스펙트럴 클러스터링(spectral clustering)을 하여 그룹들을 생성하는 동작;상기 그룹들 각각에 대응하는 링크들의 클러스터링 효과(clustering effects)를 분석하여, 상기 그룹들 각각에 대한 기 설정된 임계 값 이상의 링크들을 추출하는 동작;상기 그룹들 각각에 대해, 상기 추출된 링크들을 포함하는 코어 토픽 그래프 패턴을 생성하는 동작을 포함하는 지식 그래프를 정제하기 위한 방법
|
5 |
5
제 1항에 있어서, 상기 코어 토픽 그래프들을 기초로, 상기 지식 그래프에 포함된 링크의 중요도를 산출하는 동작은,상기 지식 그래프에서 상기 코어 토픽 그래프들 각각에 대응되는 토픽 그래프를 검출하는 동작, 및통계적 산출 지표 중 하나인 기 설정된 완전성 기준에 기초하여, 상기 코어 토픽 그래프들 각각과 상기 검출된 토픽 그래프를 비교하여, 상기 검출된 토픽 그래프의 완전성을 평가하는 동작을 포함하며,상기 산출된 중요도를 기초로 중요도가 임계 값보다 낮은 링크를 필터링하여 상기 지식 그래프를 정제하는 동작은상기 완전성 평가에 기초하여, 상기 검출된 토픽 그래프에서, 상기 중요도가 임계 값보다 낮은 상기 완전성 기준을 만족하지 못하는 링크들을 제거하여, 최종 지식 부분 그래프를 생성하는 동작을 포함하는 지식 그래프를 정제하기 위한 방법
|
6 |
6
컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,데이터베이스에 저장된 지식 그래프에서 식별 가능한 복수 개의 그래프 형태들을 확인하며, 토픽과 관련된 정보에 기초하여 상기 확인된 복수개의 그래프 형태들 중에서 하나의 개체를 공유하는 프레임워크들의 집합으로써, 공유되는 상기 개체가 중심이 되며, 상기 중심이 되는 개체와 상기 중심이 되는 개체에 연결된 다수개의 노드들을 포함하는 패턴인 개체 중심의 그래프 패턴을 식별하고, 상기 식별된 개체 중심의 그래프 패턴을 기준으로 패턴 매칭을 통해 상기 지식 그래프에서 상기 식별된 개체 중심의 그래프 패턴에 대응하는 엔터티 중심 그래프들을 식별하는 동작;상기 엔터티 중심 그래프들을 클러스터링하여 비어 있는 하나의 중심 노드와 상기 중심 노드에 연결되는 비어 있는 주변 노드의 집합을 포함하는 패턴의 코어 토픽 그래프들을 생성하는 동작;상기 코어 토픽 그래프들을 기초로, 상기 지식 그래프에서 상기 코어 토픽 그래프들 각각에 대응되는 토픽 그래프를 검출하고, 상기 코어 토픽 그래프들 각각과 상기 검출된 토픽 그래프간의 유사도에 따라 상기 지식 그래프에 포함된 링크의 중요도를 산출하는 동작; 및상기 산출된 중요도를 기초로 중요도가 임계 값보다 낮은 링크를 필터링하여 상기 지식 그래프를 정제하는 동작을 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 판독 가능한 기록 매체
|
7 |
7
컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면,데이터베이스에 저장된 지식 그래프에서 식별 가능한 복수 개의 그래프 형태들을 확인하며, 토픽과 관련된 정보에 기초하여 상기 확인된 복수개의 그래프 형태들 중에서 하나의 개체를 공유하는 프레임워크들의 집합으로써, 공유되는 상기 개체가 중심이 되며, 상기 중심이 되는 개체와 상기 중심이 되는 개체에 연결된 다수개의 노드들을 포함하는 패턴인 개체 중심의 그래프 패턴을 식별하고, 상기 식별된 개체 중심의 그래프 패턴을 기준으로 패턴 매칭을 통해 상기 지식 그래프에서 상기 식별된 개체 중심의 그래프 패턴에 대응하는 엔터티 중심 그래프들을 식별하는 동작;상기 엔터티 중심 그래프들을 클러스터링하여 비어 있는 하나의 중심 노드와 상기 중심 노드에 연결되는 비어 있는 주변 노드의 집합을 포함하는 패턴의 코어 토픽 그래프들을 생성하는 동작;상기 코어 토픽 그래프들을 기초로, 상기 지식 그래프에서 상기 코어 토픽 그래프들 각각에 대응되는 토픽 그래프를 검출하고, 상기 코어 토픽 그래프들 각각과 상기 검출된 토픽 그래프간의 유사도에 따라 상기 지식 그래프에 포함된 링크의 중요도를 산출하는 동작; 및상기 산출된 중요도를 기초로 중요도가 임계 값보다 낮은 링크를 필터링하여 상기 지식 그래프를 정제하는 동작을 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 프로그램
|
8 |
8
지식 그래프를 정제하기 위한 장치에 있어서,프로세서; 및상기 프로세서와 전기적으로 연결된 메모리를 포함하며, 상기 메모리는 프로세서가, 데이터베이스에 저장된 지식 그래프에서 식별 가능한 복수 개의 그래프 형태들을 확인하며, 토픽과 관련된 정보에 기초하여 상기 확인된 복수개의 그래프 형태들 중에서 하나의 개체를 공유하는 프레임워크들의 집합으로써, 공유되는 상기 개체가 중심이 되며, 상기 중심이 되는 개체와 상기 중심이 되는 개체에 연결된 다수개의 노드들을 포함하는 패턴인 개체 중심의 그래프 패턴을 식별하고, 상기 식별된 개체 중심의 그래프 패턴을 기준으로 패턴 매칭을 통해 상기 지식 그래프에서 상기 식별된 개체 중심의 그래프 패턴에 대응하는 엔터티 중심 그래프들을 수집하며, 상기 엔터티 중심 그래프들을 클러스터링하여 비어 있는 하나의 중심 노드와 상기 중심 노드에 연결되는 비어 있는 주변 노드의 집합을 포함하는 패턴의 코어 토픽 그래프들을 생성하며, 상기 코어 토픽 그래프들을 기초로, 상기 지식 그래프에서 상기 코어 토픽 그래프들 각각에 대응되는 토픽 그래프를 검출하고, 상기 코어 토픽 그래프들 각각과 상기 검출된 토픽 그래프간의 유사도에 따라 상기 지식 그래프에 포함된 링크의 중요도를 산출하며, 상기 산출된 중요도를 기초로 중요도가 임계 값보다 낮은 링크를 필터링하여 상기 지식 그래프를 정제하도록 하는 명령을 포함하는 지식 그래프를 정제하기 위한 장치
|