1 |
1
온라인 상의 사용자들에 의하여 작성된 비정형데이터로부터 범죄탐지를 수행하는 시스템에 있어서,비정형데이터를 구성하는 게시글 및 댓글이 저장되되, 게시글과 해당 게시글에 대한 댓글을 포함하는 게시글 그룹이 각각 구분되어 저장된 게시물 데이터베이스,상기 게시글 그룹에 대한 패턴정보를 저장하는 패턴정보 데이터베이스, 상기 비정형데이터로부터 범죄탐지를 수행하는 프로그램을 저장하는 저장부, 및상기 프로그램을 실행하는 프로세서를 포함하되,상기 프로세서는 상기 프로그램의 수행에 따라 범죄탐지를 위한 대상 비정형데이터를 가공처리하고, 상기 가공처리된 데이터 중 대상 텍스트를 추출하고, 상기 대상 텍스트와 상기 패턴정보에 대응하는 연관성 점수를 산출하여 임계값과 비교하고,상기 연관성 점수가 임계값 미만인 경우, 상기 대상 텍스트를 이상점으로 판단하고, 상기 대상 텍스트로부터 키워드를 추출하고,상기 게시물 데이터베이스에 포함된 이상점 게시글 및 이상점 댓글 중 상기 추출된 키워드와 매칭되는 이상점 게시글 또는 이상점 댓글을 추출하고, 상기 대상 텍스트와 상기 추출된 이상점 게시글 또는 상기 추출된 이상점 댓글을 군집화하되,상기 패턴정보는 상기 게시글 그룹에 포함된 각 게시물 별로 추출되는 하나 이상의 형태소를 포함하고, 상기 연관성 점수는 상기 게시글 그룹에 대한 패턴정보 및 상기 대상 텍스트의 매칭에 기초하여 산출되는 범죄탐지를 수행하는 시스템
|
2 |
2
제 1항에 있어서,상기 프로세서는 상기 게시글 그룹에 포함된 문장을 구성하는 형태소 쌍을 추출하고, 상기 형태소 쌍의 출현 빈도 및 인접 정도에 기초하여 각 형태소 쌍에 대한 누적 연관성 점수를 산출하여, 상기 게시글 그룹에 대한 패턴정보 정보를 생성하는 것인 범죄탐지를 수행하는 시스템
|
3 |
3
제 2항에 있어서,상기 프로세서는 하나의 문장에 각 형태소 쌍이 서로 인접하여 배치된 경우의 연관성 점수를 서로 다른 문장에 각 형태소가 배치된 경우의 연관성 점수 보다 높게 설정하여 상기 누적 연관성 점수를 산출하는 것인 범죄탐지를 수행하는 시스템
|
4 |
4
제 2항에 있어서,상기 프로세서는 하나의 문장에 각 형태소 쌍이 서로 인접하여 배치된 경우의 연관성 점수를 제 1 점수로 설정하고, 하나의 문장에 각 형태소 쌍이 이격되어 배치된 경우의 연관성 점수를 제 2 점수로 설정하고, 서로 다른 문장에 각 형태소가 배치된 경우의 연관성 점수를 제 3 점수로 설정하되, 상기 제 1 점수는 상기 제 2 점수 및 상기 제 3 점수보다 높은 값으로 설정되고, 상기 제 2 점수는 상기 제 3 점수보다 높은 값으로 설정되는 범죄탐지를 수행하는 시스템
|
5 |
5
제 1항에 있어서,상기 추출된 키워드는 상기 이상점으로 판단된 대상 텍스트에 대한 형태소 정보 또는 상기 이상점으로 판단된 대상 텍스트에 포함된 명사 정보인 범죄탐지를 수행하는 시스템
|
6 |
6
제 1항에 있어서,상기 프로세서는 상기 대상 텍스트에 대응하는 연관성 점수가 임계값 이상일 경우, 상기 대상 텍스트가 이상점이 아니라고 판단하며, 상기 대상 텍스트로부터 형태소를 추출하고, 상기 대상 텍스트의 형태소 쌍의 연관성 점수를 산출하고, 상기 형태소 및 상기 형태소 쌍의 연관성 점수에 기초하여 상기 대상 텍스트에 대응하는 패턴정보를 생성하며, 상기 대상 텍스트에 대응하는 패턴정보를 상기 패턴정보 데이터베이스에 갱신하는 것인 범죄탐지를 수행하는 시스템
|
7 |
7
제 1항에 있어서, 상기 프로세서는 상기 추출된 키워드를 기초로 상기 대상 텍스트가 포함된 게시글 그룹으로부터 상기 이상점 댓글을 추출하는 것인, 범죄탐지를 수행하는 시스템
|
8 |
8
제 1항에 있어서,상기 프로세서는 상기 추출된 키워드를 기초로 상기 대상 텍스트가 포함되지 않은 다른 게시글 그룹으로부터 상기 이상점 게시글 또는 이상점 댓글을 추출하는 것인 범죄탐지를 수행하는 시스템
|
9 |
9
제 1항에 있어서상기 프로세서는 상기 게시글 그룹을 각각 가공처리하여 게시물 데이터베이스에 저장하되, 상기 가공처리는 상기 대상 비정형데이터에 대하여 특수문자를 제거한 텍스트에 대하여 형태소 분석한 정보를 저장하는 것인 범죄탐지를 수행하는 시스템
|
10 |
10
제 1항에 있어서, 상기 프로세서는 상기 군집화된 이상점 게시글 또는 이상점 댓글을 그 작성 시점에 따라 시계열적으로 시각화하여 표시하되, 작성 날짜를 기준으로 하는 X 축과 작성시간을 기준으로 하는 Y축 상에 2차원 그래프 상으로 표시하는 것인 범죄탐지를 수행하는 시스템
|
11 |
11
범죄탐지를 수행하는 시스템의 범죄탐지 방법에 있어서,비정형데이터를 구성하는 게시글 및 댓글이 저장되되, 게시글과 해당 게시글에 대한 댓글을 포함하는 게시글 그룹이 각각 구분되어 저장된 게시물 데이터베이스에 대하여 범죄탐지를 위한 대상 비정형데이터를 가공처리하는 단계;상기 가공처리된 데이터 중 대상 텍스트를 추출하는 단계;상기 추출된 대상 텍스트와 상기 게시글 그룹에 대한 패턴정보에 대응하는 연관성 점수를 산출하여 임계값과 비교하는 단계;상기 연관성 점수가 임계값 미만인 경우, 상기 대상 텍스트를 이상점으로 판단하고, 상기 대상 텍스트로부터 키워드를 추출하는 단계;상기 게시물 데이터베이스에 포함된 이상점 게시글 및 이상점 댓글 중 상기 추출된 키워드와 매칭되는 이상점 게시글 또는 이상점 댓글을 추출하는 단계; 및상기 대상 텍스트와 상기 추출된 이상점 게시글 또는 상기 추출된 이상점 댓글을 군집화하는 단계를 포함하되, 상기 패턴정보는 상기 게시글 그룹에 포함된 각 게시물 별로 추출되는 하나 이상의 형태소를 포함하고, 상기 연관성 점수는 상기 게시글 그룹에 대한 패턴정보 및 상기 대상 텍스트의 매칭에 기초하여 산출되는 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
12 |
12
제 11항에 있어서,상기 임계값을 비교하는 단계 이전에, 상기 게시글 그룹에 대한 패턴정보를 패턴정보 데이터베이스에 저장하는 단계를 더 포함하되,상기 패턴정보 데이터베이스에 저장하는 단계는,상기 게시글 그룹에 포함된 문장을 구성하는 형태소 쌍을 추출하는 단계;상기 추출된 형태소 쌍의 출현 빈도 및 인접 정도에 기초하여 각 형태소 쌍에 대한 누적 연관성 점수를 산출하는 단계; 및상기 각 형태소 쌍에 대한 연관성 점수를 패턴정보 데이터베이스에 저장하는 단계를 포함하는 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
13 |
13
제 12항에 있어서,상기 누적 연관성 점수를 산출하는 단계는,하나의 문장에 각 형태소 쌍이 서로 인접하여 배치된 경우의 연관성 점수를 서로 다른 문장에 각 형태소가 배치된 경우의 연관성 점수 보다 높게 설정하여 상기 누적 연관성 점수를 산출하는 것인 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
14 |
14
제 13항에 있어서,상기 누적 연관성 점수를 산출하는 단계는,하나의 문장에 각 형태소 쌍이 서로 인접하여 배치된 경우의 연관성 점수를 제 1 점수로 설정하고, 하나의 문장에 각 형태소 쌍이 이격되어 배치된 경우의 연관성 점수를 제 2 점수로 설정하고, 서로 다른 문장에 각 형태소가 배치된 경우의 연관성 점수를 제 3 점수로 설정하되, 상기 제 1 점수는 상기 제 2 점수 및 상기 제 3 점수보다 높은 값으로 설정되고, 상기 제 2 점수는 상기 제 3 점수보다 높은 값으로 설정되는 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
15 |
15
제 11항에 있어서,상기 대상 비정형데이터를 가공처리하는 단계는,상기 대상 비정형데이터에 대하여 특수문자를 제거하는 단계; 및상기 제거된 텍스트에 대하여 형태소를 분류하는 단계를 포함하는 것인 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
16 |
16
제 11항에 있어서,상기 키워드를 추출하는 단계는,상기 대상 텍스트가 이상점에 해당할 경우 키워드 추출 알고리즘을 통해 상기 키워드를 추출하되,상기 추출된 키워드는 상기 이상점으로 판단된 대상 텍스트에 대한 형태소 정보 또는 상기 이상점으로 판단된 대상 텍스트에 포함된 명사 정보인 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|
17 |
17
제 11항에 있어서, 상기 군집화하는 단계는,상기 군집화된 이상점 게시글 또는 이상점 댓글을 그 작성 시점에 따라 시계열적으로 시각화하는 단계를 더 포함하고, 상기 시각화는 작성 날짜를 기준으로 하는 X 축과 작성시간을 준으로 하는 Y축 상에 2차원 그래프 상에서 이루어지는 것인, 범죄탐지를 수행하는 시스템의 범죄탐지 방법
|