1 |
1
프로세서 및 상기 프로세서에 의해 실행되는 명령어들을 저장하는 메모리를 포함하는 전자 디바이스에서 단어, 개념(concept) 및 문서로 구성된 문서 요소의 유사도를 산출하는 방법에 있어서,상기 단어를 나타내는(representing) 단어 공간, 상기 개념을 나타내는 개념 공간 및 상기 문서를 나타내는 문서 공간이 서로 직교하도록 구성된 3차원 공간에서, 다수의 상기 문서를 포함하는 문서 집합을 나타내는 단계;상기 문서 요소 중 어느 하나를 선택하고, 선택된 문서 요소 중에서 적어도 2개 이상의 유사도 산출 대상을 추출하는 단계; 및상기 추출된 적어도 2개 이상의 유사도 산출 대상 간의 유사도를 산출하는 단계를 포함하며,상기 유사도 산출 대상은,상기 단어 공간, 상기 개념 공간 및 상기 문서 공간 중에서 상기 선택된 문서 요소를 나타내는 어느 하나의 공간을 제외한 나머지 2개의 공간으로 표현되며,상기 유사도 산출 대상은,상기 나머지 2개의 공간 각각이 행(row)과 열(column)로 맵핑되는 행렬(matrix)로 표현되는문서 요소의 유사도를 산출하는 방법
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 유사도를 산출하는 단계는,상기 적어도 2개 이상의 유사도 산출 대상에 대응하는 행렬 간의 코사인 유사도를 이용하여 상기 유사도를 산출하는문서 요소의 유사도를 산출하는 방법
|
4 |
4
제 3 항에 있어서,상기 코사인 유사도는,상기 행렬 간 프로베니우스(frobenius) 곱 및 각 행렬에 대한 L2-놈(norm)을 기초로 산출하는문서 요소의 유사도를 산출하는 방법
|
5 |
5
제 1 항에 있어서,상기 다수의 문서를 포함하는 문서 집합을 나타내는 단계는,상기 문서에 포함된 단어를 나타내는 단어 벡터를 생성하는 단계;상기 단어가 상기 문서 내에서 갖는 개념에 대한 강도(weight)를 나타내는 개념 벡터를 생성하는 단계;상기 단어 벡터와 상기 개념 벡터를 기초로 상기 단어 벡터에 대응되는 상기 단어 공간과 상기 개념 벡터에 대응되는 상기 개념 공간이 각각 행과 열로 맵핑되는 행렬로, 상기 문서를 표현하는 단계; 및상기 행렬로 표현된, 다수의 상기 문서 각각을 상기 문서 공간 방향으로 적층하여 상기 3차원 공간에 표현하는 단계를 포함하는문서 요소의 유사도를 산출하는 방법
|
6 |
6
제 1 항에 있어서,상기 개념 공간은,온톨로지(ontology)를 기초로 생성되는문서 요소의 유사도를 산출하는 방법
|
7 |
7
제 1 항에 있어서,상기 개념에는,온라인 백과사전을 구성하는 웹페이지가 할당되는문서 요소의 유사도를 산출하는 방법
|
8 |
8
제 5 항에 있어서,상기 개념 벡터를 생성하는 단계는,상기 단어 벡터를 구성하는 어느 하나의 단어인 제1 단어를 중심 단어(center word)로 설정하는 단계;상기 제1 단어를 기준으로 상기 단어 벡터에서 기 지정된 반경(radius) 내에 있는 단어를 주변 단어로 설정하는 단계;상기 제1 단어와 상기 주변 단어 각각이 상기 개념에 포함되는지 여부를 판단하는 단계; 및상기 제1 단어와 상기 주변 단어 각각이 상기 개념에 포함되는지 여부를 기초로 상기 제1 단어의 상기 개념에 대한 강도를 산출하는 단계를 포함하는문서 요소의 유사도를 산출하는 방법
|
9 |
9
제 8 항에 있어서,상기 개념은, 해당 개념을 나타내는 적어도 하나의 키워드를 포함하고,상기 제1 단어와 상기 주변 단어 각각이 상기 개념에 포함되는지 여부를 판단하는 단계는,상기 제1 단어와 상기 주변 단어 각각이, 상기 적어도 하나의 키워드 중 적어도 하나와 일치하는지 여부를 기초로 판단하는문서 요소의 유사도를 산출하는 방법
|
10 |
10
프로세서 및 상기 프로세서에 의해 실행되는 명령어들을 저장하는 메모리를 포함하는 전자 디바이스에서 단어, 개념(concept) 및 문서로 구성된 문서 요소에 대한 망(network)을 구축하는 방법에 있어서,상기 단어를 나타내는(representing) 단어 공간, 상기 개념을 나타내는 개념 공간 및 상기 문서를 나타내는 문서 공간이 서로 직교하도록 구성된 3차원 공간에서, 다수의 상기 문서를 포함하는 문서 집합을 나타내는 단계;상기 문서 요소 중 어느 하나를 선택하고, 선택된 문서 요소 중에서 적어도 2개 이상의 유사도 산출 대상을 추출하는 단계; 상기 추출된 적어도 2개 이상의 유사도 산출 대상 간의 유사도를 산출하는 단계; 및상기 유사도를 기초로 상기 선택된 문서 요소에 대한 망을 생성하는 단계를 포함하며,상기 유사도 산출 대상은,상기 단어 공간, 상기 개념 공간 및 상기 문서 공간 중에서 상기 선택된 문서 요소를 나타내는 어느 하나의 공간을 제외한 나머지 2개의 공간으로 표현되는문서 요소에 대한 망을 구축하는 방법
|