1 |
1
책 또는 전자 책의 주제어를 추출하는 방법으로서,상기 책 또는 전자 책에 포함된 본문 내용을 복수의 분리 영역들로 분리하는 단계;상기 분리 영역들 각각에 대해 형태소 분석을 수행함으로써 각 분리 영역에 포함된 단어들과 상기 단어들의 빈도수를 추출하는 단계;상기 복수의 분리 영역들에서 중요 문장과 일반 문장을 분리하는 단계;상기 중요 문장에 포함된 중요 단어들과, 상기 중요 단어들에 대한 빈도수를 근거로, 각 중요 단어에 대한 중요 문장 가중치를 계산하는 단계; 및상기 단어들의 빈도수와 상기 중요 문장에 대한 중요 문장 가중치를 근거로, 상기 책 또는 전자 책에 대한 주제어를 도출하는 단계를 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
2 |
2
제1항에 있어서,상기 분리 영역은, 머리말 영역, 본문 영역 및 맺음말 영역을 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
3 |
3
제2항에 있어서,상기 중요 문장은,상기 본문 영역 내에서 특수 기호들 사이에 존재하는 특수 문장을 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
4 |
4
제2항에 있어서,상기 중요 문장은,상기 머리말 영역 및 맺음말 영역에 포함된 각 문장을 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
5 |
5
제1항에 있어서,상기 일반 문장에 포함된 일반 단어들과, 상기 일반 단어들에 대한 빈도수를 근거로, 각 일반 단어에 대한 일반 문장 가중치를 계산하는 단계를 더 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
6 |
6
제5항에 있어서,상기 중요 문장 가중치는 상기 일반 문장 가중치보다 높은 것을 특징으로 하는, 주제어 추출 방법
|
7 |
7
제1항 내지 제6항 중 어느 한 항에 따른 방법을 구현하기 위한 프로그램이 기록된 컴퓨터-판독 가능한 저장 매체
|
8 |
8
책 또는 전자 책의 주제어를 추출하는 방법으로서,상기 책 또는 전자 책에 포함된 본문 내용을 복수의 분리 영역들로 분리하는 단계;상기 분리 영역들 각각에 대해 형태소 분석을 수행함으로써 각 분리 영역에 포함된 단어들과 상기 단어들의 빈도수를 추출하는 단계;상기 복수의 분리 영역들에서 중요 문장과 일반 문장을 분리하는 단계;상기 중요 문장에 포함된 중요 단어들과, 상기 중요 단어들에 대한 빈도수를 근거로, 각 중요 단어에 대한 문장 가중치를 계산하는 단계; 및상기 단어들의 빈도수와 상기 중요 문장에 대한 문장 가중치를 근거로, 상기 책 또는 전자 책에 대한 주제어를 도출하는 단계를 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
9 |
9
제8항에 있어서,상기 본문 내용을 복수의 분리 영역들로 분리하는 단계는, 상기 본문 내용에 포함된 개행 문자를 근거로, 상기 본문 내용을 문단 별로 구분함으로써 이루어지는 것을 특징으로 하는, 주제어 추출 방법
|
10 |
10
제9항에 있어서,상기 중요 문장은,각 문단에 속한 첫 문장과 마지막 문장, 그리고 부사로 시작되는 문장 중 적어도 하나를 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
11 |
11
제8항에 있어서,상기 중요 문장은,상기 복수의 분리 영역들 중 상기 책 또는 전자 책의 결론과 요약 중 적어도 하나에 대응하는 분리 영역들의 문장을 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
12 |
12
제8항에 있어서,각 분리 영역에 포함된 문장들에서 주어 및 목적어를 구분하는 단계를 더 포함하는 것을 특징으로 하는, 주제어 추출 방법
|
13 |
13
제12항에 있어서,상기 주어 및 목적어에 대한 구성 요소 가중치를 계산하는 단계를 더 포함하고, 상기 책 또는 전자 책에 대한 주제어를 도출하는 단계는, 상기 구성 요소 가중치를 더 고려함으로써 이루어지는 것을 특징으로 하는, 주제어 추출 방법
|
14 |
14
제8항 내지 제13항 중 어느 한 항에 따른 방법을 구현하기 위한 프로그램이 기록된 컴퓨터-판독 가능한 저장 매체
|