1 |
1
관심지점 명을 구성하는 적어도 하나 이상의 관심어를 추출하고, 추출된 관심어와 카테고리 기준단어를 비교하여 해당 관심지점 명에 대한 유사도에 대응되는 카테고리별 단어분석값을 산출하는 단어분석수단과, 웹문서에서 관심지점 명이 포함된 적어도 하나 이상의 문장으로 구성되는 관심영역을 추출하며, 관심영역에서 관심지점 명 주변에 위치하는 카테고리 기준단어를 검색함과 더불어, 검색된 카테고리 기준단어과 관심지점 명간의 이격 거리에 대응되도록 문맥 가중치를 부여하여 카테고리별 문맥분석값을 산출하는 문맥분석수단 및, 상기 카테고리별 상기 단어분석값과 상기 문맥분석값을 합성하여 카테고리별 분류값을 산출하되, 단어분석값과 문맥분석값에 대해 분석 가중치를 부여하여 생성되는 분류값을 근거로 분류값이 최고값인 카테고리를 해당 관심지점의 카테고리로 설정하는 카테고리 설정수단을 포함하여 구성되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
2 |
2
제1항에 있어서,상기 단어분석수단은 스트링 커널 방식을 이용하여 관심어와 카테고리 기준단어와의 유사도를 분석하도록 구성되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
3 |
3
제1항에 있어서,상기 관심지점 명에서 추출되는 관심어는 적어도 하나 이상의 문자로 이루어지는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
4 |
4
제1항 내지 제3항 중 어느 한 항에 있어서,상기 단어분석수단은 관심어를 이루는 문자의 길이에 대응되도록 단어 가중치를 부여하여 단어분석값을 산출하도록 구성되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
5 |
5
제1항에 있어서,상기 문맥분석수단은 카테고리 기준단어와 관심지점 명간의 이격 거리를 설정함에 있어서, 관심지점 명과 카테고리 기준단어 사이에 위치하는 단어 수에 대응되도록 설정되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
6 |
6
제1항 또는 제5항에 있어서,상기 문맥분석수단은 가중치가 가장 높은 중심 지점을 관심지점 명으로 설정하는 경우, 이 관심지점 명으로부터 이격 거리가 멀어질수록 카테고리 기준단어에 대한 문맥 가중치가 감소하도록 설정되는 가우시안 분포 형태로 설정되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
7 |
7
제1항 또는 제5항에 있어서,상기 문맥분석수단은 기준단어의 출현 빈도수를 추가로 고려하여 상기 문맥가중치를 설정하도록 구성되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
8 |
8
제1항에 있어서,상기 카테고리 분류수단은 상기 단어분석값과 문맥분석값에 대한 분석 가중치를 설정하여 카테고리 분석값을 산출함에 있어서, 상기 분석 가중치는 하기의 수학식과 같이 설정되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
9 |
9
제7항에 있어서,상기 분석 가중치는 관심어의 길이가 길수록 분석 가중치의 값이 커지도록 설정되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
10 |
10
제1항에 있어서,상기 카테고리별 기준단어 및 관심지점에 대한 카테고리 정보를 저장하기 위한 데이터베이스 및,관심지점 명에 대한 카테고리 정보를 상기 데이터베이스에서 독출하여 외부장치로 제공하는 통신수단을 추가로 포함하여 구성되는 것을 특징으로 하는 관심지점 카테고리 분류장치
|
11 |
11
정보입력수단에서 입력되는 카테고리별 기준단어를 등록하는 제1 단계와,단어분석수단에서 상기 정보입력수단으로부터 제공되는 관심지점 명에 대해 이를 구성하는 적어도 하나 이상의 관심어를 추출하고, 추출된 관심어와 카테고리 기준단어를 비교하여 해당 관심지점 명에 대한 유사도에 대응되는 카테고리별 단어분석값을 산출하는 제2 단계,문맥분석수단에서 관심지점 명이 포함된 웹문서로부터 해당 관심지점 명이 포함된 적어도 하나 이상의 문장으로 구성되는 관심영역을 추출하고, 관심영역에서 관심지점 명 주변에 위치하는 카테고리 기준단어를 검색함과 더불어, 검색된 카테고리 기준단어과 관심지점 명간의 이격 거리에 대응되도록 문맥 가중치를 부여하여 카테고리별 문맥분석값을 산출하는 제3 단계 및,카테고리 분류수단에서 상기 제2 단계에서 산출된 카테고리별 상기 단어분석값과 제3 단계에서 산출된 문맥분석값을 합성하여 카테고리 분석값을 산출하되, 단어분석값과 문맥분석값에 대해 분석 가중치를 부여하여 생성되는 분류값을 근거로 분류값이 최고값인 카테고리를 해당 관심지점의 카테고리로 설정하는 제4 단계를 포함하여 구성되는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
12 |
12
제11항에 있어서,상기 제2 단계에서 단어분석수단은 스트링 커널 방식을 이용하여 관심어와 카테고리 기준단어와의 유사도를 분석하여 관심지점 명에 대한 단어분석값을 산출하는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
13 |
13
제11항에 있어서,상기 제2 단계에서 단어분석수단은 상기 관심지점 명에 대해 적어도 하나 이상의 문자로 이루어지는 관심어를 추출하는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
14 |
14
제11항 내지 제13항 중 어느 한 항에 있어서,상기 제2 단계에서 단어분석수단은 관심어를 구성하는 문자의 길이에 대응되도록 단어 가중치를 적용하여 단어분석값을 산출하는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
15 |
15
제11항에 있어서,상기 제3 단계에서 카테고리 기준단어와 관심지점 명간의 이격 거리는 관심지점 명과 카테고리 기준단어 사이에 위치하는 단어의 수인 것을 특징으로 하는 관심지점 카테고리 분류방법
|
16 |
16
제11항 또는 제15항에 있어서,상기 제3 단계에서 문맥분석수단은 기준단어의 출현 빈도수를 추가로 고려하여 상기 문맥가중치를 설정하는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
17 |
17
제11항 또는 제15항에 있어서,상기 제3 단계에서 상기 문맥분석값에 부여되는 문맥 가중치는 문맥 가중치가 가장 높은 중심 지점을 관심지점 명으로 설정하는 경우, 이 관심지점 명으로부터 이격 거리가 멀어질수록 카테고리 기준단어에 대한 문맥 가중치가 감소하도록 설정되는 가우시안 분포 형태로 설정되는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
18 |
18
제11항에 있어서,상기 제3 단계에서 문맥분석수단은 상기 단어분석값과 문맥분석값에 대한 분석 가중치를 설정하여 카테고리별 분류값을 산출함에 있어서, 상기 분석 가중치를 하기의 수학식과 같이 설정하는 것을 특징으로 하는 관심지점 카테고리 분류방법
|
19 |
19
제18항에 있어서,상기 분석 가중치는 관심어의 길이가 길수록 분석 가중치의 값이 커지도록 설정되는 것을 특징으로 하는 관심지점 카테고리 분류방법
|