1 |
1
문서를 복수 개의 세그먼트로 나누고, 상기 문서로부터 복수 개의 키워드, 상기 키워드가 위치하는 세그먼트 정보 및 상기 키워드의 빈도수를 추출하는 키워드 추출부;상기 키워드 추출부에서 추출된 상기 키워드, 세그먼트 정보 및 빈도수를 이용하여, 상기 문서에 대한 세그먼트 인덱스를 생성하는 세그먼트 인덱스 생성부; 및상기 세그먼트 인덱스 생성부에서 생성된 상기 세그먼트 인덱스를 이용하여 상기 문서의 특정 세그먼트에 대한 주제어를 선정하되, 추출된 상기 키워드의 상기 특정 세그먼트에서의 중요도를 계산하고, 계산된 상기 중요도 값이 높은 순서대로 소정 개수의 키워드를 주제어로 선정하는 주제어 계산부를 포함하며,상기 키워드의 중요도는, 상기 문서 내 각각의 세그먼트 내에서의 상기 키워드의 빈도 및 상기 각각의 세그먼트와 상기 특정 세그먼트 사이의 거리에 따른 가중치에 의하여 계산되는, 텍스트 색인 장치
|
2 |
2
제1항에 있어서,상기 세그먼트 인덱스의 각 행은 상기 문서의 세그먼트이고, 각 열은 상기 추출된 키워드이며, 상기 세그먼트 인덱스의 각 셀은 상기 셀이 위치하는 행에 해당하는 세그먼트에서의 상기 셀이 위치하는 열에 해당하는 키워드의 빈도수인, 텍스트 색인 장치
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서,상기 중요도는, 다음의 수학식키워드 j의 중요도 = W0*F0j+W1*F1j+W2*F2j+
|
5 |
5
제 4 항에 있어서,상기 가중치는, 상기 특정 세그먼트부터의 거리에 따라 작아지도록 설정되는, 텍스트 색인 장치
|
6 |
6
제 1 항에 있어서,상기 주제어 계산부는상기 키워드 추출부에서 추출된 키워드의 빈도수 값이 높은 순서대로 소정 개수의 키워드를 주제어로 선정하는, 텍스트 색인 장치
|
7 |
7
텍스트 색인 장치에서, 문서를 복수 개의 세그먼트로 분할하는 단계;상기 텍스트 색인 장치에서, 상기 세그먼트로 분할된 문서로부터 복수 개의 키워드, 상기 키워드가 위치하는 세그먼트 정보 및 상기 키워드의 빈도수를 추출하는 단계;상기 텍스트 색인 장치에서, 상기 키워드 추출부에서 추출된 상기 키워드, 세그먼트 정보 및 빈도수를 이용하여, 상기 문서에 대한 세그먼트 인덱스를 생성하는 단계; 및상기 텍스트 색인 장치에서, 상기 세그먼트 인덱스 생성부에서 생성된 상기 세그먼트 인덱스를 이용하여 상기 문서의 특정 세그먼트에 대한 주제어를 선정하되, 추출된 키워드의 상기 특정 세그먼트에서의 중요도를 계산하고, 계산된 상기 중요도 값이 높은 순서대로 소정 개수의 키워드를 주제어로 선정하는 단계를 포함하며,상기 키워드의 중요도는, 상기 문서 내 각각의 세그먼트 내에서의 상기 키워드의 빈도 및 상기 각각의 세그먼트와 상기 특정 세그먼트 사이의 거리에 따른 가중치에 의하여 계산되는, 텍스트 색인 방법
|
8 |
8
삭제
|
9 |
9
삭제
|
10 |
10
제 7 항에 있어서,상기 텍스트 색인 장치에서, 상기 중요도는, 다음의 수학식키워드 j의 중요도 = W0*F0j+W1*F1j+W2*F2j+
|
11 |
11
제 10 항에 있어서, 상기 텍스트 색인 장치에서, 상기 가중치는, 상기 특정 세그먼트부터의 거리에 따라 작아지도록 설정되는, 텍스트 색인 방법
|
12 |
12
제 7 항에 있어서, 상기 텍스트 색인 장치에서, 상기 주제어를 선정하는 단계는, 키워드 추출부에서 추출된 키워드의 빈도수 값이 높은 순서대로 소정 개수의 키워드를 주제어로 선정하는, 텍스트 색인 방법
|
13 |
13
제 7 항 또는 제10항 내지 제 12 항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 저장매체
|