1 |
1
문서 및 검색 키워드를 입력받는 인터페이스부;상기 문서로부터 복수의 문단을 구분하여 상기 복수의 문단이 배치된 순서대로 번호를 부여하고, 상기 복수의 문단 중에서 상기 검색 키워드가 포함된 문단들을 추출하는 추출부; 및상기 추출된 문단들 내 상기 검색 키워드의 빈도수에 기초하여 상기 검색 키워드에 대한 가중치를 계산하고, 상기 추출된 문단들 중에서 상기 가중치가 가장 낮은 검색 키워드만을 포함한 문단을 제거하여 상기 추출된 문단들을 정제하고, 상기 정제된 문단들을 N(상기 N은 자연수)개의 영역으로 나눈 후, 상기 N개의 각 영역별 문단들에 포함된 상기 검색 키워드의 빈도수를 상기 각 영역별 문단들의 개수로 나누어, 각 영역별로 상기 검색 키워드의 평균 빈도수를 계산하고, 상기 계산된 평균 빈도수에 기초하여 상기 각 영역별 문단들의 중요도를 계산하며, 상기 각 영역별 문단들의 중요도를 비교하여 가장 높은 중요도를 갖는 영역을 주요 영역으로 선정하며, 상기 선정된 주요 영역에 포함된 문단들을 상기 부여된 번호 순서대로 정렬하여 출력하는 프로세서를 포함하고,상기 프로세서는각각의 검색 키워드가 포함된 문단의 개수를 합하여 총 개수를 산출하고, 총 개수 대비 특정 검색 키워드가 포함된 문단의 개수에 대한 비율을, 상기 특정 검색 키워드에 대한 가중치로서 산출하며,상기 정제된 문단들의 개수를 상기 N으로 나눈 값으로 상기 각 영역별 문단들의 개수를 정하되, 나머지 값이 발생하는 경우 상기 나머지 값을 맨 뒤에 배치된 영역에서부터 상기 나머지 값이 소진될 때가지 각 영역에 균등하게 순차적으로 가산하여 상기 각 영역별 문단들의 개수를 정하는 것을 특징으로 하는 문서 분석 기반 주요 요소 추출 시스템
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 프로세서는하나의 문단 내에 상기 가중치가 가장 낮은 검색 키워드 이외의 다른 검색 키워드가 존재하는 경우에는 예외 처리하여 해당 문단의 제거 기능을 수행하지 않는 것을 특징으로 하는 문서 분석 기반 주요 요소 추출 시스템
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
제1항에 있어서,상기 인터페이스부는상기 문서의 키워드 태그의 태그 값에 해당하는 키워드들을 불러온 뒤 해당 키워드들을 출력하여 사용자에게 보여주고, 상기 출력된 키워드들 중 상기 사용자에 의해 입력된 키워드를 상기 검색 키워드로서 입력받는 것을 특징으로 하는 문서 분석 기반 주요 요소 추출 시스템
|
8 |
8
제1항에 있어서,상기 추출부는상기 검색 키워드가 복수 개일 경우, 상기 추출된 문단들 중 동일한 번호가 부여된 문단이 복수 개 존재하면 상기 복수의 문단 중 하나의 문단 이외의 나머지 문단을 상기 추출된 문단들에서 제거하는 것을 특징으로 하는 문서 분석 기반 주요 요소 추출 시스템
|
9 |
9
문서 분석 기반 주요 요소 추출 시스템의 인터페이스부가 문서 및 검색 키워드를 입력받는 단계;상기 문서 분석 기반 주요 요소 추출 시스템의 추출부가 상기 문서로부터 복수의 문단을 구분하여 상기 복수의 문단이 배치된 순서대로 번호를 부여하고, 상기 복수의 문단 중에서 상기 검색 키워드가 포함된 문단들을 추출하는 단계;상기 문서 분석 기반 주요 요소 추출 시스템의 프로세서가 상기 추출된 문단들 내 상기 검색 키워드의 빈도수에 기초하여 상기 검색 키워드에 대한 가중치를 계산하는 단계;상기 프로세서가 상기 추출된 문단들 중에서 상기 가중치가 가장 낮은 검색 키워드만을 포함한 문단을 제거하여 상기 추출된 문단들을 정제하는 단계;상기 프로세서가 상기 정제된 문단들을 N(상기 N은 자연수)개의 영역으로 나눈 후, 상기 N개의 각 영역별 문단들에 포함된 상기 검색 키워드의 빈도수를 상기 각 영역별 문단들의 개수로 나누어, 각 영역별로 상기 검색 키워드의 평균 빈도수를 계산하고, 상기 계산된 평균 빈도수에 기초하여 상기 각 영역별 문단들의 중요도를 계산하는 단계;상기 프로세서가 상기 각 영역별 문단들의 중요도를 비교하여 가장 높은 중요도를 갖는 영역을 주요 영역으로 선정하는 단계; 및상기 프로세서가 상기 선정된 주요 영역에 포함된 문단들을 상기 부여된 번호 순서대로 정렬하여 출력하는 단계를 포함하고,상기 가중치를 계산하는 단계는각각의 검색 키워드가 포함된 문단의 개수를 합하여 총 개수를 산출하고, 총 개수 대비 특정 검색 키워드가 포함된 문단의 개수에 대한 비율을, 상기 특정 검색 키워드에 대한 가중치로서 산출하는 단계를 포함하며,상기 중요도를 계산하는 단계는상기 정제된 문단들의 개수를 상기 N으로 나눈 값으로 상기 각 영역별 문단들의 개수를 정하되, 나머지 값이 발생하는 경우 상기 나머지 값을 맨 뒤에 배치된 영역에서부터 상기 나머지 값이 소진될 때가지 각 영역에 균등하게 순차적으로 가산하여 상기 각 영역별 문단들의 개수를 정하는 단계를 포함하는 것을 특징으로 하는 문서 분석 기반 주요 요소 추출 방법
|
10 |
10
삭제
|
11 |
11
삭제
|
12 |
12
삭제
|
13 |
13
삭제
|