1 |
1
시간 정보를 활용하여 블로그의 카테고리를 분류하는 방법에 있어서,상기 블로그 내에서 사용되는 단어들을 상기 블로그 내의 문서로부터 추출하는 단어 추출 단계;상기 추출된 단어들이 상기 블로그 내의 문서 내에서 출현한 빈도를 시간축 상에 분포시켜 상기 단어 출현의 시간적인 분포를 나타내는 종합 시간 정보 값을 계산하는 계산 단계; 및상기 단어들의 종합 시간 정보 값에 따라 상기 블로그의 카테고리를 분류하는 분류 단계를 포함하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
2 |
2
제 1 항에 있어서, 상기 계산 단계가,상기 추출된 단어들의 상기 출현 빈도를 계산하는 출현 빈도 계산 단계;현재 시점을 기점으로 상기 출현 빈도를 고려하여 상기 단어들의 최근 출현 빈도를 계산하는 최근 출현 빈도 계산 단계; 및상기 최근 출현 빈도와 상기 단어들의 시간축 상 분포의 균형성 정도를 나타내는 스태디니스(steadiness) 값을 기반으로 산술적 연산을 수행하여 상기 종합 시간 정보 값을 계산하는 시간 정보 계산 단계를 포함하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
3 |
3
제 2 항에 있어서, 상기 출현 빈도 계산 단계에서,상기 출현 빈도가, 상기 블로그 내의 하나의 문서에서 상기 단어가 사용된 횟수를 나타내는 단어 빈도와, 상기 블로그 내의 문서의 수를 상기 단어를 포함하는 문서의 수로 나눈 문서 빈도를 곱하여 계산되는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
4 |
4
제 2 항에 있어서, 상기 최근 출현 빈도 계산 단계에서,상기 최근 출현 빈도가, 상기 블로그 내에서 가장 최근에 언급된 단어에 가중치를 주어 계산되는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
5 |
5
제 2 항에 있어서, 상기 최근 출현 빈도 계산 단계에서,상기 최근 출현 빈도가 (여기서, tfi×idfi는 상기 출현 빈도, tfi는 단어 빈도, idfi는 문서 빈도, current time은 현재 날짜, time of d는 상기 단어가 출현한 날짜 및 D는 상기 단어가 출현하는 전체 문서의 개수를 나타냄)을 통해 계산되는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
6 |
6
제 2 항에 있어서, 상기 시간 정보 계산 단계에서,상기 스태디니스 값이 상기 단어의 출현 날짜와 상기 단어가 출현한 전체 기간의 중간 날짜의 차를 상기 단어가 나타난 전체 횟수로 나눈 시간 분산 값인 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
7 |
7
제 5 항에 있어서, 상기 시간 정보 계산 단계에서,상기 종합 시간 정보 값이 상기 최근 출현 빈도와 상기 스태디니스 값의 곱으로 계산되는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 방법
|
8 |
8
시간 정보를 활용하여 블로그의 카테고리를 분류하는 장치에 있어서,상기 블로그 내에서 사용되는 단어들을 상기 블로그 내의 문서로부터 추출하는 단어 추출부;상기 추출된 단어들이 상기 블로그 내의 문서 내에서 출현한 빈도를 시간축 상에 분포시켜 상기 단어 출현의 시간적인 분포를 나타내는 종합 시간 정보 값을 계산하는 계산부; 및상기 단어들의 종합 시간 정보 값에 따라 상기 블로그의 카테고리를 분류하는 분류부를 포함하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
9 |
9
제 8 항에 있어서, 상기 계산부가,상기 추출된 단어들의 상기 출현 빈도를 계산하는 출현 빈도 계산부;현재 시점을 기점으로 상기 출현 빈도를 고려하여 상기 단어들의 최근 출현 빈도를 계산하는 최근 출현 빈도 계산부; 및상기 최근 출현 빈도와 상기 단어들의 시간축 상 분포의 균형성 정도를 나타내는 스태디니스(steadiness) 값을 기반으로 산술적 연산을 수행하여 상기 단어들의 종합 시간 정보 값을 계산하는 시간 정보 계산부를 포함하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
10 |
10
제 9 항에 있어서, 상기 출현 빈도 계산부가,상기 블로그 내의 하나의 문서에서 상기 단어가 사용된 횟수를 나타내는 단어 빈도와, 상기 블로그 내의 문서의 수를 상기 단어를 포함하는 문서의 수로 나눈 문서 빈도를 곱하여 상기 출현 빈도를 계산하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
11 |
11
제 9 항에 있어서, 상기 최근 출현 빈도 계산부가,상기 블로그 내에서 가장 최근에 언급된 단어에 가중치를 주어 상기 최근 출현 빈도를 계산하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
12 |
12
제 9 항에 있어서, 상기 최근 출현 빈도 계산부가,(여기서, tfi×idfi는 상기 출현 빈도, tfi는 단어 빈도, idfi는 문서 빈도, current time은 현재 날짜, time of d는 상기 단어가 출현한 날짜 및 D는 상기 단어가 출현하는 전체 문서의 개수를 나타냄)을 통해 상기 최근 출현 빈도를 계산하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
13 |
13
제 9 항에 있어서, 상기 스태디니스 값이 상기 단어의 출현 날짜와 상기 단어가 출현한 전체 기간의 중간 날짜의 차를 상기 단어가 나타난 전체 횟수로 나눈 시간 분산값인 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|
14 |
14
제 13 항에 있어서, 상기 시간 정보 계산부가,상기 최근 출현 빈도와 상기 스태디니스 값의 곱으로 상기 종합 시간 정보 값을 계산하는 것을 특징으로 하는 시간 정보를 활용한 블로그 카테고리 분류 장치
|