1 |
1
스토리를 생성하기 위한 장치에 있어서, 복수의 뉴스 기사의 텍스트, 상기 텍스트에 부여된 태그의 리스트 및 상기 태그와 연결된 텍스트의 리스트를 저장하는 저장부; 태그 리스트의 복수의 태그 중 적어도 하나의 태그가 선택되면, 상기 선택된 태그와 연결된 복수의 텍스트를 로드하는 텍스트처리모듈; 상기 로드된 복수의 텍스트를 내용에 따라 클러스터링하고, 가장 많은 수의 텍스트가 포함된 클러스터에 속하는 복수의 텍스트를 복수의 메인 텍스트로 분류하고, 나머지 클러스터에 속하는 복수의 텍스트를 복수의 부가 텍스트로 분류하는 텍스트분류모듈; 상기 복수의 메인 텍스트로부터 상기 복수의 메인 텍스트 각각의 대푯값을 추출하는 메인텍스트가공모듈; 복수의 부가 텍스트 중 어느 하나의 부가 텍스트의 대푯값을 추출하는 부가텍스트가공모듈; 및 상기 추출된 상기 복수의 메인 텍스트 각각의 대푯값 및 상기 추출된 하나의 부가 텍스트의 대푯값을 시간 순서에 따라 배열하여 스토리를 생성하는 스토리생성모듈;을 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 장치
|
2 |
2
제1항에 있어서, 상기 메인텍스트가공모듈은 상기 복수의 메인 텍스트에서 중복되는 텍스트를 검출하여 중복된 텍스트를 소거하는 중복 제거를 수행하고, 상기 복수의 메인 텍스트를 텍스트의 내용에 따라 클러스터링하여 복수의 클러스터를 생성하며, 생성된 복수의 클러스터로부터 클러스터의 중심을 대푯값으로 선택하는 것을 특징으로 하는 스토리를 생성하기 위한 장치
|
3 |
3
제1항에 있어서, 상기 부가텍스트가공모듈은 상기 복수의 부가 텍스트에서 중복되는 텍스트를 검출하여 중복된 텍스트를 소거하는 중복 제거를 수행하고, 상기 복수의 부가 텍스트를 텍스트의 내용에 따라 클러스터링하여 복수의 클러스터를 생성하며, 상기 복수의 클러스터 중 가장 많은 수의 텍스트가 포함된 클러스터를 선택하고, 생성된 복수의 클러스터로부터 클러스터의 중심을 대푯값으로 선택하는 것을 특징으로 하는 스토리를 생성하기 위한 장치
|
4 |
4
제1항에 있어서, 상기 장치는 뉴스 기사가 포함된 웹 페이지를 서비스하는 웹 서버와 통신하기 위한 통신부; 및 상기 통신부를 통해 상기 웹 서버에 접속하여 상기 뉴스 기사가 포함된 웹 페이지를 다운로드하고, 상기 웹 페이지로부터 텍스트를 추출하여, 복수의 뉴스 기사의 텍스트, 상기 텍스트에 부여된 태그의 리스트 및 상기 태그와 연결된 텍스트의 리스트를 생성하고, 상기 저장부에 저장하는 텍스트수집모듈;을 더 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 장치
|
5 |
5
스토리를 생성하기 위한 방법에 있어서, 복수의 뉴스 기사의 텍스트, 상기 텍스트에 부여된 태그의 리스트 및 상기 태그와 연결된 텍스트의 리스트를 저장하는 단계; 상기 태그 리스트의 복수의 태그 중 적어도 하나의 태그가 선택되면, 상기 선택된 태그와 연결된 복수의 텍스트를 로드하는 단계; 상기 로드된 복수의 텍스트를 내용에 따라 클러스터링하고, 가장 많은 수의 텍스트가 포함된 클러스터에 속하는 복수의 텍스트를 복수의 메인 텍스트로 분류하고, 나머지 클러스터에 속하는 복수의 텍스트를 복수의 부가 텍스트로 분류하는 단계; 상기 복수의 메인 텍스트로부터 상기 복수의 메인 텍스트 각각의 대푯값을 추출하는 단계; 복수의 부가 텍스트 중 어느 하나의 부가 텍스트의 대푯값을 추출하는 단계; 및 상기 추출된 상기 복수의 메인 텍스트 각각의 대푯값 및 상기 추출된 하나의 부가 텍스트의 대푯값을 시간 순서에 따라 배열하여 스토리를 생성하는 단계;를 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 방법
|
6 |
6
제5항에 있어서, 상기 복수의 메인 텍스트 각각의 대푯값을 추출하는 단계는 상기 복수의 메인 텍스트에서 중복되는 텍스트를 검출하여 중복된 텍스트를 소거하는 중복 제거를 수행하는 단계; 상기 복수의 메인 텍스트를 텍스트의 내용에 따라 클러스터링하여 복수의 클러스터를 생성하는 단계; 및 상기 생성된 복수의 클러스터로부터 클러스터의 중심을 대푯값으로 선택하는 단계;를 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 방법
|
7 |
7
제5항에 있어서, 상기 하나의 부가 텍스트의 대푯값을 추출하는 단계는 상기 복수의 부가 텍스트에서 중복되는 텍스트를 검출하여 중복된 텍스트를 소거하는 중복 제거를 수행하는 단계; 상기 복수의 부가 텍스트를 텍스트의 내용에 따라 클러스터링하여 복수의 클러스터를 생성하는 단계; 상기 복수의 클러스터 중 가장 많은 수의 텍스트가 포함된 클러스터를 선택하는 단계; 및 상기 생성된 복수의 클러스터로부터 클러스터의 중심을 대푯값으로 선택하는 단계;를 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 방법
|
8 |
8
제5항에 있어서, 상기 저장하는 단계는 뉴스 기사가 포함된 웹 페이지를 서비스하는 웹 서버에 접속하여 상기 뉴스 기사가 포함된 웹 페이지를 다운로드하는 단계; 및 상기 웹 페이지로부터 텍스트를 추출하여, 복수의 뉴스 기사의 텍스트, 상기 텍스트에 부여된 태그의 리스트 및 상기 태그와 연결된 텍스트의 리스트를 생성하여 저장하는 단계;를 포함하는 것을 특징으로 하는 스토리를 생성하기 위한 방법
|