1 |
1
HTML(HyperText Markup Language) 문서의 데이터를 구성하는 각각의 단위 텍스트 중 태그를 기준으로 표제 단위 텍스트를 추출하여 키워드 추출부에 제공하는 표제 추출부;
상기 표제 단위 텍스트를 구성하는 각각의 단어 중 품사를 기준으로 키워드 데이터를 추출하는 키워드 추출부;
전체 상기 단위 텍스트 중 상기 표제 단위 텍스트를 제외한 각각의 본문 단위 텍스트에 포함된 문장 중, 해당 본문 단위 텍스트 직전의 상기 표제 단위 텍스트에서 추출된 상기 키워드 데이터를 가장 많이 포함하는 중심 문장 데이터를 추출하는 중심 문장 추출부; 및
추출된 상기 표제 데이터 및 추출된 상기 중심 문장 데이터로 구성되는 요약 문서 데이터를 생성하는 요약 문서 생성부를 포함하는 HTML 문서 요약 시스템
|
2 |
2
제 1 항에 있어서,
상기 HTML 문서 데이터를 HTML 태그를 바탕으로 파싱하여 하나 이상의 단위 텍스트로 분리한 후 각 단위 텍스트에 대해 중요도 값을 부여하는 파싱부를 더 포함하고,
상기 표제 추출부는,
상기 각 단위 텍스트에 대한 중요도 값을 상기 파싱부로부터 제공 받아 상기 표제 단위 텍스트 추출에 참조하는 HTML 문서 요약 시스템
|
3 |
3
제 2 항에 있어서,
상기 파싱부는,
단락의 구성을 설정하는 태그 및 글자의 외형을 설정하는 태그의 동일성 여부를 기준으로 상기 단위 텍스트를 분리하는 HTML 문서 요약 시스템
|
4 |
4
제 3 항에 있어서,
상기 단락의 구성을 설정하는 태그는, ‘003c#TITLE003e#’, ‘003c#H003e#’, ‘003c#P003e#’, ‘003c#BR003e#’ 중 적어도 하나를 포함하고,
상기 글자의 외형을 설정하는 태그는, ‘003c#TT003e#’, ‘003c#I003e#’, ‘003c#B003e#’, ‘003c#U003e#’, ‘003c#BIG003e#’, ‘003c#SMALL003e#’, ‘003c#EM003e#’, ‘003c#STRONG003e#’, ‘003c#FONT003e#’, ‘003c#A003e#’ 중 적어도 하나를 포함하는 HTML 문서 요약 시스템
|
5 |
5
제 2 항에 있어서,
상기 표제 추출부는,
상기 각 단위 텍스트에 대한 중요도 값이 기준 값 이상인 경우 해당 단위 텍스트를 표제 단위 텍스트로 판정하여 상기 키워드 추출부에 제공하고, 상기 각 단위 텍스트에 대한 중요도 값이 기준 값 미만인 경우 해당 단위 텍스트를 본문 단위 텍스트로 판정하여 해당 단위 텍스트의 데이터를 포함한 본문 HTML 파일을 생성하여 저장하는 HTML 문서 요약 시스템
|
6 |
6
제 5 항에 있어서,
상기 요약 문서 생성부는,
상기 중심 문장 데이터에 대하여 상기 중심 문장이 속했던 단위 텍스트의 데이터가 저장된 상기 본문 HTML 파일에 대한 링크를 부가하는 HTML 문서 요약 시스템
|
7 |
7
제 1 항에 있어서,
단말로부터 HTML 문서 데이터의 송신 요청을 받고 상기 표제 추출부에 상기 HTML 문서 데이터의 표제 추출 트리거(trigger)를 제공하고, 상기 요약 문서 생성부에 의해 상기 요청된 HTML 문서 데이터에 대응하는 요약 문서 데이터가 생성되면, 상기 요청된 HTML 문서 데이터의 원본 대신 상기 요약 문서 데이터를 상기 단말에 송신하는 인터페이스부를 더 포함하는 HTML 요약 시스템
|
8 |
8
제 7 항에 있어서,
상기 인터페이스부는,
상기 단말의 운영체제가 범용 운영체제가 아닌 경우에 한하여 상기 표제 추출부에 상기 HTML 문서 데이터의 표제 추출 트리거(trigger)를 제공하는 HTML 요약 시스템
|
9 |
9
제 7 항에 있어서,
상기 인터페이스부는,
상기 단말에 설정된 운영체제의 해상도가 미리 정해진 것보다 작은 경우에 한하여 상기 표제 추출부에 상기 HTML 문서 데이터의 표제 추출 트리거(trigger)를 제공하는 HTML 요약 시스템
|
10 |
10
HTML 문서의 데이터를 구성하는 각각의 단위 텍스트 중 태그를 기준으로 표제 단위 텍스트를 추출하는 단계;
상기 표제 단위 텍스트를 구성하는 각각의 단어 중 품사를 기준으로 키워드 데이터를 추출하는 단계;
전체 상기 단위 텍스트 중 상기 표제 단위 텍스트를 제외한 각각의 본문 단위 텍스트에 포함된 문장 중, 해당 본문 단위 텍스트 직전의 상기 표제 단위 텍스트에서 추출된 상기 키워드 데이터를 가장 많이 포함하는 중심 문장 데이터를 추출하는 단계; 및
추출된 상기 표제 데이터 및 추출된 상기 중심 문장 데이터로 구성되는 요약 문서 데이터를 생성하는 단계를 포함하는 HTML 문서 요약 방법
|
11 |
11
제 10 항에 있어서,
상기 표제 단위 텍스트를 추출하는 단계 이전에 상기 HTML 문서 데이터를 HTML 태그를 바탕으로 파싱하여 하나 이상의 단위 텍스트로 분리한 후 각 단위 텍스트에 대해 중요도 값을 부여하는 단계를 더 포함하고,
상기 표제 단위 텍스트를 추출하는 단계는,
상기 각 단위 텍스트에 대한 중요도 값을 상기 파싱부로부터 제공 받아 상기 표제 단위 텍스트 추출에 참조하는 단계를 포함하는 HTML 문서 요약 방법
|
12 |
12
제 11 항에 있어서,
상기 각 단위 텍스트에 대해 중요도 값을 부여하는 단계는,
단락의 구성을 설정하는 태그 및 글자의 외형을 설정하는 태그의 동일성 여부를 기준으로 상기 단위 텍스트를 분리하는 단계를 포함하는 HTML 문서 요약 방법
|
13 |
13
제 11 항에 있어서,
상기 표제 단위 텍스트를 추출하는 단계는,
상기 각 단위 텍스트에 대한 중요도 값이 기준 값 이상인 경우 해당 단위 텍스트를 표제 단위 텍스트로 판정하는 단계; 및
상기 각 단위 텍스트에 대한 중요도 값이 기준 값 미만인 경우 해당 단위 텍스트를 본문 단위 텍스트로 판정하여 해당 단위 텍스트의 데이터를 포함한 본문 HTML 파일을 생성하여 저장하는 단계를 포함하는 HTML 문서 요약 방법
|
14 |
14
제 13 항에 있어서,
상기 요약 문서 데이터를 생성하는 단계는,
상기 중심 문장 데이터에 대하여 상기 중심 문장이 속했던 단위 텍스트의 데이터가 저장된 상기 본문 HTML 파일에 대한 링크를 부가하는 단계를 더 포함하는 HTML 문서 요약 방법
|
15 |
15
제 10 항에 있어서,
상기 표제 단위 텍스트를 추출하는 단계 이전에, 단말로부터 HTML 문서 데이터의 송신 요청을 받고 상기 요약 문서 데이터의 송신 여부를 판정하는 단계; 및
요약 문서 데이터를 생성하는 단계 이후에, 상기 송신 여부를 판정하는 단계에서의 판정 결과 상기 요약 문서 데이터를 송신해야 하는 경우로 판정된 경우 요청된 HTML 문서 데이터의 원본 대신 상기 요약 문서 데이터를 상기 단말에 송신하는 단계를 더 포함하는 HTML 요약 방법
|
16 |
16
제 15 항에 있어서,
상기 상기 요약 문서 데이터의 송신 여부를 판정하는 단계 이전에, 상기 단말의 운영 체제의 종류 및 상기 단말이 현재 사용하는 해상도에 따른 픽셀 수 중 적어도 하나를 바탕으로하여 상기 요약 문서 데이터의 송신 여부를 판정하는 단계를 더 포함하는 HTML 요약 방법
|