1 |
1
소셜 네트워크 서비스 데이터를 수집하여 저장하고, 행정구역별 지리 정보 사전을 구축하고, 검색용어로 사용하지 않는 단어인 불용어를 제거하고 데이터를 정제하고, 명사를 추출하는 데이터 전처리 과정을 수행하는 데이터 수집 모듈;상기 데이터 수집 모듈에서 정제된 데이터를 이용하여 초기 그래프를 모델링하는 초기 그래프 모델링 모듈;타임 윈도우 내의 연관 문서를 분석하여 그래프를 업데이트하는 연관 데이터 반영 모듈; 및업데이트된 그래프에 대하여 그래프 클러스터링을 통해 지역 이벤트를 검출하는 이벤트 검출 모듈을 포함하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
2 |
2
청구항 1에 있어서, 상기 데이터 수집 모듈은, 수집한 소셜 네트워크 서비스 데이터에서 특수문자, 초성 및 링크를 제거하고, 형태소 분석을 실행하여 명사를 추출하는 방식으로 데이터 전처리 과정을 수행하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
3 |
3
청구항 1에 있어서, 상기 초기 그래프 모델링 모듈은, 지리 정보가 포함되어 있는 지오 태그(Geo-Tag)가 있는 데이터에 대해서는 지오 태그 정보를 그대로 이용하여 지역 노드로 사용하고, 지리 정보가 없는 데이터에 대하여 지역, 지명 및 키워드를 추출하고, 사전에 구축된 지리 정보 사전을 바탕으로 일치하는 지리 정보가 있으면, 해당 지리 정보를 데이터에 임베딩하는 방식으로 데이터에 지리 정보를 부여하여 지역 노드로 사용하고, 지역 노드가 포함되어 있으며, 키워드를 기반으로 정점과 간선으로 이루어진 키워드 기반 그래프를 생성하고, 해당 소셜 네트워크 서비스의 특성을 반영하여 상기 키워드 기반 그래프의 각 정점과 간선에 가중치를 부여하고, 정점들 중에서 중심이 되는 키 노드를 선정하는 방식으로 초기 그래프 모델링을 수행하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
4 |
4
청구항 3에 있어서, 상기 초기 그래프 모델링 모듈은, 각 정점에 키워드 타입을 부여하되, 각 정점의 해당 키워드가 지역, 지명에 해당하거나 지오 태그가 있으면 지리정보 타입을 부여하고, 나머지 키워드에 일반 단어 타입을 부여하고, 각 정점에서 해당 키워드와 동시 출현한 키워드의 정점을 간선으로 연결하는 방식으로 키워드 기반 그래프를 생성하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
5 |
5
청구항 4에 있어서, 상기 초기 그래프 모델링 모듈은, 각 정점과 간선들에 대해 가중치를 부여하되, 정해진 타임 윈도우에서 해당 키워드의 출현 빈도에 따라 각 정점에 가중치를 부여하고, 해당하는 두 키워드의 동시 출현 빈도에 따라 각 간선에 가중치를 부여하고, 각 정점 가중치와 각 간선 가중치를 이용하여 각 정점에 부여되는 점수를 계산하고, 각 정점에 부여된 점수를 이용하여 핵심 단어를 의미하는 키 노드를 선정하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
6 |
6
청구항 5에 있어서, 상기 연관 데이터 반영 모듈은, 초기 그래프가 구축된 상태에서 댓글, 스레드 게시물을 포함하는 연관 문서가 발생하면, 데이터 전처리를 통해 상기 연관 문서에서 지역 키워드를 추출하고, 초기 그래프에서 지역 키워드와 일치하는 키 노드가 있으면 초기 그래프에 상기 연관 문서 내용을 추가하여 업데이트하고, 초기 그래프에서 지역 키워드와 일치하는 키 노드가 없으면, 상기 연관 문서에서 나머지 키워드를 추출하고, 초기 그래프에서 나머지 키워드와 일치하는 키워드가 있으면, 초기 그래프에 상기 연관 문서 내용을 추가하여 업데이트하고, 일치하는 키워드가 없으면 별도의 그래프를 생성하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
7 |
7
청구항 6에 있어서, 상기 이벤트 검출 모듈은, 키 노드를 기준으로 연결된 간선 중 가중치 α보다 크거나 같은 간선으로 연결된 정점들을 하나의 클러스터로 묶고, 생성된 클러스터들 사이의 연관 관계를 분석하여, 연관이 없는 클러스터들은 간선을 끊어 독립된 클러스터로 생성하고, 연관이 있는 클러스터들은 병합하고, 이러한 방식으로 도출된 각 독립적인 클러스터를 지역 이벤트로 검출하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
8 |
8
청구항 7에 있어서, 상기 가중치 α는 그래프 내 노드들의 클러스터링 정도를 의미하는 네트워크 모듈성을 계산하여 선정하며, m은 전체 간선 수, n은 전체 노드 수, 는 정점 와 사이를 연결하는 간선의 가중치, 는 와 연결된 모든 간선의 가중치 합이고, 는 와 가 같은 클러스터에 있으면 1, 아니면 0을 반환하는 불리언 함수라고 할 때, 네트워크 모듈성 MN을, (3)의 수학식으로 나타낼 수 있는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
9 |
9
청구항 8에 있어서, 상기 이벤트 검출 모듈은, 하나의 클러스터로 묶인 내부 정점 사이에 연결된 간선들의 평균 가중치를 내부 가중치로 정의하고, 서로 다른 두 클러스터 사이에 연결된 간선의 가중치 합을 외부 가중치로 정의할 때, 두 개의 클러스터 각각의 내부 가중치 합과 외부 가중치의 값을 비교하여, 내부 가중치의 값이 더 크면 두 개의 클러스터를 연결하는 외부 간선을 제거하여 각각 독립된 클러스터로 생성하고, 외부 가중치의 값이 더 크면 두 클러스터를 하나로 병합하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 시스템
|
10 |
10
소셜 네트워크에서 지역 이벤트 검출 시스템에서의 지역 이벤트 검출 방법에서,소셜 네트워크 서비스 데이터를 수집하여 저장하고, 행정구역별 지리 정보 사전을 구축하고, 검색용어로 사용하지 않는 단어인 불용어를 제거하고 데이터를 정제하고, 명사를 추출하는 데이터 전처리 과정을 수행하는 데이터 수집 단계;상기 데이터 수집 단계에서 정제된 데이터를 이용하여 초기 그래프를 모델링하는 초기 그래프 모델링 단계;타임 윈도우 내의 연관 문서를 분석하여 그래프를 업데이트하는 연관 데이터 반영 단계; 및업데이트된 그래프에 대하여 그래프 클러스터링을 통해 지역 이벤트를 검출하는 이벤트 검출 단계를 포함하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
11 |
11
청구항 10에 있어서, 상기 데이터 수집 단계에서, 수집한 소셜 네트워크 서비스 데이터에서 특수문자, 초성 및 링크를 제거하고, 형태소 분석을 실행하여 명사를 추출하는 방식으로 데이터 전처리 과정을 수행하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
12 |
12
청구항 10에 있어서, 상기 초기 그래프 모델링 단계에서, 지리 정보가 포함되어 있는 지오 태그(Geo-Tag)가 있는 데이터에 대해서는 지오 태그 정보를 그대로 이용하여 지역 노드로 사용하고, 지리 정보가 없는 데이터에 대하여 지역, 지명 및 키워드를 추출하고, 사전에 구축된 지리 정보 사전을 바탕으로 일치하는 지리 정보가 있으면, 해당 지리 정보를 데이터에 임베딩하는 방식으로 데이터에 지리 정보를 부여하여 지역 노드로 사용하고, 지역 노드가 포함되어 있으며, 키워드를 기반으로 정점과 간선으로 이루어진 키워드 기반 그래프를 생성하고, 해당 소셜 네트워크 서비스의 특성을 반영하여 상기 키워드 기반 그래프의 각 정점과 간선에 가중치를 부여하고, 정점들 중에서 중심이 되는 키 노드를 선정하는 방식으로 초기 그래프 모델링을 수행하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
13 |
13
청구항 12에 있어서, 상기 초기 그래프 모델링 단계에서, 각 정점에 키워드 타입을 부여하되, 각 정점의 해당 키워드가 지역, 지명에 해당하거나 지오 태그가 있으면 지리정보 타입을 부여하고, 나머지 키워드에 일반 단어 타입을 부여하고, 각 정점에서 해당 키워드와 동시 출현한 키워드의 정점을 간선으로 연결하는 방식으로 키워드 기반 그래프를 생성하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
14 |
14
청구항 13에 있어서, 상기 초기 그래프 모델링 단계에서, 각 정점과 간선들에 대해 가중치를 부여하되, 정해진 타임 윈도우에서 해당 키워드의 출현 빈도에 따라 각 정점에 가중치를 부여하고, 해당하는 두 키워드의 동시 출현 빈도에 따라 각 간선에 가중치를 부여하고, 각 정점 가중치와 각 간선 가중치를 이용하여 각 정점에 부여되는 점수를 계산하고, 각 정점에 부여된 점수를 이용하여 핵심 단어를 의미하는 키 노드를 선정하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
15 |
15
청구항 14에 있어서, 상기 연관 데이터 반영 단계에서, 초기 그래프가 구축된 상태에서 댓글, 스레드 게시물을 포함하는 연관 문서가 발생하면, 데이터 전처리를 통해 상기 연관 문서에서 지역 키워드를 추출하고, 초기 그래프에서 지역 키워드와 일치하는 키 노드가 있으면 초기 그래프에 상기 연관 문서 내용을 추가하여 업데이트하고, 초기 그래프에서 지역 키워드와 일치하는 키 노드가 없으면, 상기 연관 문서에서 나머지 키워드를 추출하고, 초기 그래프에서 나머지 키워드와 일치하는 키워드가 있으면, 초기 그래프에 상기 연관 문서 내용을 추가하여 업데이트하고, 일치하는 키워드가 없으면 별도의 그래프를 생성하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
16 |
16
청구항 15에 있어서, 상기 이벤트 검출 단계에서, 키 노드를 기준으로 연결된 간선 중 가중치 α보다 크거나 같은 간선으로 연결된 정점들을 하나의 클러스터로 묶고, 생성된 클러스터들 사이의 연관 관계를 분석하여, 연관이 없는 클러스터들은 간선을 끊어 독립된 클러스터로 생성하고, 연관이 있는 클러스터들은 병합하고, 이러한 방식으로 도출된 각 독립적인 클러스터를 지역 이벤트로 검출하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
17 |
17
청구항 16에 있어서, 상기 가중치 α는 그래프 내 노드들의 클러스터링 정도를 의미하는 네트워크 모듈성을 계산하여 선정하며, m은 전체 간선 수, n은 전체 노드 수, 는 정점 와 사이를 연결하는 간선의 가중치, 는 와 연결된 모든 간선의 가중치 합이고, 는 와 가 같은 클러스터에 있으면 1, 아니면 0을 반환하는 불리언 함수라고 할 때, 네트워크 모듈성 MN을, (3)의 수학식으로 나타낼 수 있는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|
18 |
18
청구항 17에 있어서, 상기 이벤트 검출 단계에서, 하나의 클러스터로 묶인 내부 정점 사이에 연결된 간선들의 평균 가중치를 내부 가중치로 정의하고, 서로 다른 두 클러스터 사이에 연결된 간선의 가중치 합을 외부 가중치로 정의할 때, 두 개의 클러스터 각각의 내부 가중치 합과 외부 가중치의 값을 비교하여, 내부 가중치의 값이 더 크면 두 개의 클러스터를 연결하는 외부 간선을 제거하여 각각 독립된 클러스터로 생성하고, 외부 가중치의 값이 더 크면 두 클러스터를 하나로 병합하는 것을 특징으로 하는 소셜 네트워크에서 지역 이벤트 검출 방법
|