1 |
1
소정의 시드 뉴스의 각 문장과, 중복 뉴스의 문장 간의 유사도를 산출하고, 산출한 상기 유사도 중에서 최대값에 해당하는 최대 유사도를 산출하는 유사도 산출부; 및산출된 상기 최대 유사도를 소정의 임계값과 비교하며, 상기 최대 유사도가 상기 임계값 미만이면 상기 중복 뉴스의 문장을 상기 중복 뉴스의 문장과의 유사도가 최대로 나타나는 시드 뉴스의 문장 바로 다음에 추가하여 결합 뉴스를 생성하는 결합 뉴스 생성부를 포함하는 중복 뉴스 결합 시스템
|
2 |
2
제1항에 있어서,상기 결합 뉴스 생성부는,상기 중복 뉴스의 문장과의 유사도가 상기 최대값으로 나타나는 상기 시드 뉴스의 문장과, 이의 다음 문장의 사이에 상기 중복 뉴스의 문장을 추가하는 중복 뉴스 결합 시스템
|
3 |
3
제1항에 있어서,상기 유사도 산출부는 상기 중복 뉴스의 문장마다 상기 최대 유사도를 산출하며,상기 결합 뉴스 생성부는 상기 중복 뉴스의 문장들 중에서 상기 최대 유사도가 상기 임계값 미만에 해당하는 문장을 상기 시드 뉴스에 결합하여 결합 뉴스를 생성하는 중복 뉴스 결합 시스템
|
4 |
4
제1항에 있어서,상기 중복 뉴스 결합 시스템은,상기 시드 뉴스에 대한 중복 뉴스 그룹에 속하는 모든 중복 뉴스에 대하여, 상기 최대 유사도가 상기 임계값 미만인 상기 중복 뉴스의 문장을 상기 시드 뉴스에 결합하며, 상기 시드 뉴스와 상기 중복 뉴스 그룹에 속하는 상기 모든 중복 뉴스를 하나의 문서로 통합하여 상기 결합 뉴스를 생성하는 중복 뉴스 결합 시스템
|
5 |
5
제4항에 있어서,상기 하나의 문서로 통합된 상기 결합 뉴스를 웹 페이지 형태로 제공하는 뉴스 추천부를 더 포함하는 중복 뉴스 결합 시스템
|
6 |
6
제5항에 있어서,상기 뉴스 추천부는,상기 결합 뉴스 중 상기 시드 뉴스에 상기 중복 뉴스의 문장이 추가된 부분에 상기 시드 뉴스의 문장과 구별되도록 식별 표시를 하여 상기 웹 페이지 형태로 제공하는 중복 뉴스 결합 시스템
|
7 |
7
제1항에 있어서,상기 결합 뉴스 생성부는,상기 최대 유사도가 상기 임계값 이상이면 상기 중복 뉴스의 문장을 상기 시드 뉴스에 결합하지 않는 중복 뉴스 결합 시스템
|
8 |
8
제1항 내지 제7항 중 어느 한 항에 있어서,상기 유사도 산출부는,상기 시드 뉴스의 문장과, 상기 중복 뉴스의 문장으로부터 동사를 추출하며, 추출한 상기 시드 뉴스의 문장의 동사와, 상기 중복 뉴스의 문장의 동사 간의 유사도를 산출하여 상기 시드 뉴스의 문장과 상기 중복 뉴스의 문장 간의 유사도를 산출하는 중복 뉴스 결합 시스템
|
9 |
9
제1항 내지 제7항 중 어느 한 항에 있어서,상기 유사도 산출부는,상기 시드 뉴스의 문장과 상기 중복 뉴스의 문장에서 나타나는 동사를 공통으로 포함하는 워드넷 용어집 기반 계층에서의 최 하위 계층 상위 동사를 검출하고, 상기 시드 뉴스의 문장에서 나타나는 동사, 상기 중복 뉴스의 문장에서 나타나는 동사 및 상기 최 하위 계층 상위 동사의 동의어 어휘의 개수에 비례하는 연산을 수행하여 확률 값을 산출하며, 산출한 상기 확률 값을 이용하여 상기 유사도를 산출하는 중복 뉴스 결합 시스템
|
10 |
10
소정의 시드 뉴스를 저장하는 시드뉴스 데이터베이스;상기 시드 뉴스의 제목에 나타나는 단어를 포함하는 검색어를 이용하여 대상 뉴스들을 검색하는 검색 엔진;검색된 상기 대상 뉴스들을 저장하는 대상 뉴스 데이터베이스;상기 시드 뉴스와 상기 대상 뉴스들 각각으로부터 제목을 추출하고, 추출한 상기 시드 뉴스의 제목과 상기 대상 뉴스의 제목 간의 유사도를 산출하며, 산출한 상기 제목 간의 유사도에 기초하여 상기 대상 뉴스들 중에서 중복 후보 뉴스를 탐지하는 중복 후보 뉴스 탐지부;상기 시드 뉴스와 상기 중복 후보 뉴스로부터 컨텐츠를 추출하고, 추출한 상기 시드 뉴스의 컨텐츠에 포함된 문장과 상기 중복 후보 뉴스의 컨텐츠에 포함된 문장 간의 유사도를 산출하며, 산출한 상기 문장 간의 유사도에 기초하여 상기 중복 후보 뉴스 중에서 중복 뉴스를 탐지하는 중복 뉴스 탐지부;탐지된 상기 중복 뉴스를 저장하는 중복 뉴스 데이터베이스;상기 시드 뉴스와 상기 중복 뉴스를 하나의 문서로 통합하여 결합 뉴스를 생성하는 중복 뉴스 결합부; 및상기 결합 뉴스를 웹 페이지 형태로 제공하는 뉴스 추천부를 포함하며,상기 중복 뉴스 결합부는,상기 시드 뉴스의 각 문장과, 상기 중복 뉴스의 문장 간의 유사도를 산출하고, 산출한 상기 유사도 중에서 최대값에 해당하는 최대 유사도를 산출하는 유사도 산출부; 및산출된 상기 최대 유사도를 소정의 임계값과 비교하며, 상기 최대 유사도가 상기 임계값 미만이면 상기 중복 뉴스의 문장을 상기 중복 뉴스의 문장과의 유사도가 최대로 나타나는 시드 뉴스의 문장 바로 다음에 추가하여 결합 뉴스를 생성하는 결합 뉴스 생성부를 포함하는 중복 뉴스 결합 시스템
|
11 |
11
제10항에 있어서,상기 결합 뉴스 생성부는,상기 중복 뉴스의 문장과의 유사도가 상기 최대값으로 나타나는 상기 시드 뉴스의 문장과, 이의 다음 문장의 사이에 상기 중복 뉴스의 문장을 추가하는 중복 뉴스 결합 시스템
|
12 |
12
제10항 또는 제11항에 있어서,상기 뉴스 추천부는,상기 결합 뉴스 중 상기 시드 뉴스에 상기 중복 뉴스의 문장이 추가된 부분에 상기 시드 뉴스의 문장과 구별되도록 식별 표시를 하여 상기 웹 페이지 형태로 제공하는 중복 뉴스 결합 시스템
|