1 |
1
SNS 사이트마다 가입되거나 등록된 계정 정보를 주기적으로 점검하여 점검된 상기 계정 정보를 XML 파싱(parsing)하여 수집하는 SNS 계정 수집 모듈;상기 XML 파싱한 결과인 계정 아이디/패스워드 정보에 기초하여 상기 SNS 사이트에 로그인된 임의의 계정을 호출하는 계정 호출 모듈;게시물 확인 오픈 API을 이용하여 상기 호출된 계정의 게시물을 수집하는 게시물 수집 모듈;상기 수집된 게시물마다 본문 내용을 저장하고, 상기 본문 내용 안에 존재하는 URL 정보를 추출, 수집하는 URL 수집 모듈; 및상기 수집된 URL 정보를 XML 문서 형태로 저장하는 URL 저장 모듈;을 포함하는 것을 특징으로 하는 SNS 트랩 수집 시스템
|
2 |
2
제 1항에 있어서,상기 URL 정보가 단축 URL인 경우, 상기 단축 URL을 생성한 원본 사이트에 접속한 후, 상기 원본 사이트로부터 원본 URL 정보를 획득하는 원본 URL 수집 모듈;을 더 포함하는 것을 특징으로 하는 SNS 트랩 수집 시스템
|
3 |
3
제 2항에 있어서,상기 URL 저장 모듈은,상기 URL 정보 및 원본 URL 정보를 상기 XML 문서 내의 BOARD 태그 또는 MSG 태그 형태로 저장하는 것을 특징으로 하는 SNS 트랩 수집 시스템
|
4 |
4
제 1항 내지 제 3항중 어느 한 항에 있어서,상기 게시물 수집 모듈은, 상기 게시물에 대해 크롤링하여 수집하는 것을 특징으로 하는 SNS 트랩 수집 시스템
|
5 |
5
제 4항에 있어서,상기 저장된 XML 문서에 기초하여 상기 URL 정보와 원본 URL 정보의 중복 여부를 각각 점검하여 중복된 상기 URL 정보와 원본 URL 정보를 제거하고, 수집 시간을 기록하는 URL 관리 모듈;을 더 포함하는 것을 특징으로 하는 SNS 트랩 수집 시스템
|
6 |
6
(a) SNS 사이트마다 가입되거나 등록된 계정 정보를 주기적으로 확인하는 점검 주기 초과 여부를 판단하는 단계;(b) 상기 판단 결과, 초과되지 않으면 점검된 상기 계정 정보를 XML 파싱(parsing)하여 수집하는 단계;(c) 상기 XML 파싱한 결과인 계정 아이디/패스워드 정보에 기초하여 상기 SNS 사이트에 로그인된 임의의 계정을 호출하는 단계;(d) 게시물 확인 오픈 API을 이용하여 상기 호출된 계정이 개시한 게시물이 있는지를 판단하는 단계;(e) 상기 게시물이 있을 경우 상기 게시물을 수집하는 단계;(f) 상기 수집된 게시물마다 본문 내용을 저장하고, 상기 본문 내용안에 존재하는 URL 정보를 추출, 수집하는 단계; 및 (g) 상기 수집된 URL 정보를 XML 문서 형태로 저장하는 단계;를 포함하는 것을 특징으로 하는 URL 수집 방법
|
7 |
7
제 6항에 있어서,상기 (b) 단계는,(h) 상기 점검 주기가 초과되면 상기 주기내의 점검 대상의 계정 수와 이미 분석된 계정 수를 비교하여 상기 분석 계정 수가 클 경우 상기 (c) 단계를 수행하는 계정 수 판단 단계;를 더 포함하는 것을 특징으로 하는 URL 수집 방법
|
8 |
8
제 6항에 있어서,(i) 상기 URL 정보가 단축 URL인 경우, 상기 단축 URL을 생성한 원본 사이트에 접속한 후, 상기 원본 사이트로부터 원본 URL 정보를 획득하는 단계;를 더 포함하는 것을 특징으로 하는 URL 수집 방법
|
9 |
9
제 8항에 있어서,(j) 상기 저장된 XML 문서에 기초하여 상기 URL 정보와 원본 URL 정보의 중복 여부를 각각 점검하여 중복된 상기 URL 정보와 원본 URL 정보를 제거하고, 수집 시간을 기록하는 단계;를 더 포함하는 것을 특징으로 하는 URL 수집 방법
|
10 |
10
제 8항에 있어서,상기 (f) 단계는,상기 URL 정보 및 원본 URL 정보를 상기 XML 문서 내의 BOARD 태그 또는 MSG 태그 형태로 저장하는 것을 특징으로 하는 URL 수집 방법
|