1 |
1
소셜 네트워크 서비스에 해당하는 데이터를 수집하는 단계; 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 단계; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 단계; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 단계를 포함하는 스팸 그룹 추출 방법
|
2 |
2
청구항 1에 있어서, 상기 비정상 행위를 탐지하는 단계는상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 방법
|
3 |
3
청구항 1에 있어서,상기 데이터를 전처리하는 단계는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 방법
|
4 |
4
청구항 1에 있어서,상기 스팸 그룹을 추출하는 단계는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하는 단계; 및 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 단계를 포함하는 것을 특징으로 하는 스팸 그룹 추출 방법
|
5 |
5
청구항 1에 있어서,상기 데이터를 수집하는 단계는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 방법
|
6 |
6
소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부;빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 자연어 처리부; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부를 포함하는 스팸 그룹 추출 장치
|
7 |
7
청구항 6에 있어서,상기 비정상 행위 탐지부는 상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 장치
|
8 |
8
청구항 6에 있어서,상기 자연어 처리부는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 장치
|
9 |
9
청구항 6에 있어서,상기 스팸 추출부는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 것을 특징으로 하는 스팸 그룹 추출 장치
|
10 |
10
청구항 6에 있어서,상기 데이터 수집부는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 장치
|