1 |
1
프로세서 및 상기 프로세서에 의해 실행되는 명령어들을 저장하는 메모리를 포함하는 전자 디바이스에서 문서를 매트릭스(matrix)로 표현하는 방법으로써,상기 문서 내의 적어도 하나의 단어를 포함하는 단어 벡터(term vector)를 생성하는 단계;상기 적어도 하나의 단어가 상기 문서 내에서 갖는 의미인 개념(concept)에 대하여, 상기 적어도 하나의 단어가 적어도 하나의 개념에 대하여 갖는 강도(weight)를 상기 적어도 하나의 개념마다 각각 산출하는 단계; 및상기 문서가 포함하는 상기 적어도 하나의 단어를 상기 매트릭스의 행(row)과 열(column) 중 어느 하나에 맵핑(mapping)하고, 상기 적어도 하나의 개념을 상기 매트릭스의 행과 열 중 다른 하나에 맵핑하여, 상기 문서를 상기 매트릭스로 표현하는 단계를 포함하며,상기 매트릭스는, 상기 적어도 하나의 단어가 상기 문서 내에서 상기 적어도 하나의 개념마다 갖는 강도를 구성요소로 포함하는문서를 매트릭스로 표현하는 방법
|
2 |
2
제 1 항에 있어서,상기 적어도 하나의 개념을 포함하는 개념 공간(concept space)을 생성하는 단계를 더 포함하는문서를 매트릭스로 표현하는 방법
|
3 |
3
제 2 항에 있어서,상기 개념 공간은,온톨로지(ontology)를 이용하여 생성되는문서를 매트릭스로 표현하는 방법
|
4 |
4
제 3 항에 있어서,상기 개념에는,온라인 백과사전을 구성하는 웹페이지가 할당되는문서를 매트릭스로 표현하는 방법
|
5 |
5
제 4 항에 있어서,상기 개념에 상기 웹페이지가 할당됨에 있어서,상기 웹페이지의 페이지 분량, 백링크(backlink) 갯수 또는 상기 웹페이지의 제목(title)에 특수문자가 포함되었는지 여부 중 적어도 하나를 기초로 상기 웹페이지가 상기 개념으로 할당될지 여부가 결정되는문서를 매트릭스로 표현하는 방법
|
6 |
6
제 4 항에 있어서,상기 개념은,상기 개념에 할당된 상기 웹페이지에 포함된 단어에 tf*idf((Term Frequency * Inverse Document Frequency) 방법을 적용하여 산출된 적어도 하나의 키워드를 포함하는문서를 매트릭스로 표현하는 방법
|
7 |
7
제 1 항에 있어서,상기 적어도 하나의 단어가 상기 적어도 하나의 개념 각각에 대하여 갖는 강도를 포함하는 개념 벡터(concept vector)를 생성하는 단계를 더 포함하며,상기 개념 벡터는 상기 단어 벡터에 포함된 상기 적어도 하나의 단어마다 생성되는문서를 매트릭스로 표현하는 방법
|
8 |
8
제 1 항에 있어서,상기 강도는,상기 적어도 하나의 단어의 상기 적어도 하나의 개념 각각에 대한 근접성을 정량적으로 나타내는문서를 매트릭스로 표현하는 방법
|
9 |
9
제 7 항에 있어서,상기 단어 벡터에 포함된 상기 적어도 하나의 단어 중 제1 단어에 대한 상기 개념 벡터를 생성하는 단계는,상기 제1 단어를 중심 단어(center word)로 설정하는 단계;상기 제1 단어를 기준으로 상기 단어 벡터에서 기 지정된 반경(radius) 내에 있는 단어를 주변 단어로 설정하는 단계;상기 제1 단어와 상기 주변 단어 각각이 상기 적어도 하나의 개념 각각에 포함되는지 여부를 상기 적어도 하나의 개념마다 각각 판단하는 단계; 및상기 판단하는 단계에서 판단한 결과를 기초로, 상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계를 포함하는문서를 매트릭스로 표현하는 방법
|
10 |
10
제 9 항에 있어서,상기 적어도 하나의 개념 각각은,해당 개념을 나타내는 적어도 하나의 키워드를 포함하는문서를 매트릭스로 표현하는 방법
|
11 |
11
제 10 항에 있어서,상기 제1 단어와 상기 주변 단어 각각이 상기 적어도 하나의 개념 각각에 포함되는지 여부를 상기 적어도 하나의 개념마다 각각 판단하는 단계는,상기 제1 단어와 상기 주변 단어 각각이, 상기 적어도 하나의 개념이 포함하는 상기 적어도 하나의 키워드 중 적어도 하나와 일치하는지 여부에 기초하여, 상기 적어도 하나의 개념마다 각각 판단하는문서를 매트릭스로 표현하는 방법
|
12 |
12
제 9 항에 있어서,상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계는,상기 제1 단어와 상기 주변 단어 각각이 상기 개념에 포함되면 해당 단어의 상기 개념에 숫자 '1'을 할당하고 포함되지 않으면 숫자 '0'을 할당하며,상기 할당된 숫자를 상기 적어도 하나의 개념마다 각각 합산한 값을 상기 제1 단어의 상기 개념에 대한 강도로 산출하는문서를 매트릭스로 표현하는 방법
|
13 |
13
제 12 항에 있어서,상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계에서,상기 합산한 값을 상기 제1 단어 및 상기 주변 단어의 갯수로 나눈 값을 상기 강도로 산출하는문서를 매트릭스로 표현하는 방법
|