1 |
1
공개 인터넷 환경에서 정보 유출자 군집을 검출하는 방법에 있어서,상기 공개 인터넷 환경 상의 데이터를 수집하는 단계;상기 수집된 데이터를 이용하여, 인터넷 사용자들 각각이 작성한 게시글을 결정하는 단계;상기 게시글을 분석함으로써, 상기 인터넷 사용자들 각각에 대한 주제어를 추출하는 단계;상기 인터넷 사용자들 각각에 대해 추출된 주제어를 이용하여, 상기 인터넷 사용자들 간의 유사성을 분석하는 단계; 및 상기 유사성 분석 결과에 기초하여 상기 정보 유출자 군집을 검출하는 단계;를 포함하고,상기 주제어를 추출하는 단계는,소정의 단어와의 연관성이 높은지 여부와 관계 없이, 상기 게시글에서 사용된 빈도수에 기초하여 상기 인터넷 사용자들 각각에 대한 주제어를 추출하는 단계;를 포함하는, 방법
|
2 |
2
제 1항에 있어서,상기 인터넷 사용자들 간의 유사성을 분석하는 단계는,상기 추출된 주제어를 이용하여 상기 인터넷 사용자들 각각에 대한 벡터 값을 산출하는 단계; 및상기 산출된 벡터 값에 기초하여 상기 인터넷 사용자들 간의 유사성을 분석하는 단계;를 포함하는, 방법
|
3 |
3
제 2항에 있어서,상기 정보 유출자 군집을 검출하는 단계는,군집 알고리즘에 상기 산출된 벡터 값을 적용하여 상기 인터넷 사용자들 중에서 유사성이 높은 인터넷 사용자들을 군집화하는 단계; 및상기 군집화된 인터넷 사용자들을 정보 유출자 군집으로 검출하는 단계;를 포함하는, 방법
|
4 |
4
제 1항에 있어서,상기 인터넷 사용자들 간의 유사성을 분석하는 단계는,상기 추출된 주제어 각각에 대한 가중치를 산출하는 단계; 및상기 산출된 가중치를 적용하여 상기 인터넷 사용자들 간의 유사성을 분석하는 단계;를 포함하는, 방법
|
5 |
5
제 1항에 있어서,상기 주제어를 추출하는 단계는,텍스트 마이닝(Text Mining) 기법을 적용하여 상기 게시글을 분석하는 단계;를 더 포함하는 방법
|
6 |
6
공개 인터넷 환경에서 정보 유출자 군집을 검출하는 장치에 있어서,상기 공개 인터넷 환경 상의 데이터를 수집하는 통신부; 및상기 수집된 데이터를 이용하여, 인터넷 사용자들 각각이 작성한 게시글을 결정하고, 상기 게시글을 분석함으로써, 상기 인터넷 사용자들 각각에 대한 주제어를 추출하고, 상기 인터넷 사용자들 각각에 대해 추출된 주제어를 이용하여, 상기 인터넷 사용자들 간의 유사성을 분석하고, 상기 유사성 분석 결과에 기초하여 상기 정보 유출자 군집을 검출하는 제어부;를 포함하고, 상기 제어부는, 소정의 단어와의 연관성이 높은지 여부와 관계 없이, 상기 게시글에서 사용된 빈도수에 기초하여 상기 인터넷 사용자들 각각에 대한 주제어를 추출하는 것인, 장치
|
7 |
7
제 6항에 있어서,상기 장치는,상기 통신부로부터 수집된 데이터를 저장하는 메모리를 더 포함하는, 장치
|
8 |
8
제 6항에 있어서,상기 제어부는,상기 추출된 주제어를 이용하여 상기 인터넷 사용자들 각각에 대한 벡터 값을 산출하고, 상기 산출된 벡터 값에 기초하여 상기 인터넷 사용자들 간의 유사성을 분석하는, 장치
|
9 |
9
제 8항에 있어서,상기 제어부는,군집 알고리즘에 상기 산출된 벡터 값을 적용하여 상기 인터넷 사용자들 중에서 유사성이 높은 인터넷 사용자들을 군집화하고, 상기 군집화된 인터넷 사용자들을 정보 유출자 군집으로 검출하는, 장치
|
10 |
10
제 1항 내지 제 5항 중에 적어도 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|