1 |
1
수집 대상 데이터 소스 모듈, 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 수집 관리 모듈;상기 수집 관리 모듈로부터 설정 받은 데이터 수집 기준에 따라 해당 데이터 소스 모듈로부터 빅데이터를 수집하여 데이터베이스 모듈에 저장하는 데이터 수집 모듈;상기 데이터베이스 모듈에 저장된 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 형태소 분석 모듈; 및상기 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하고, 상기 가상화 데이터베이스 인터페이스를 통해 상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하고 상기 통계값에 따라 위크시그널을 출력하는 데이터 분석 모듈을 포함하되, 상기 통계 분석 알고리즘은 기술 및 시장 예측 모형에 활용되는 지표를 산출하기 위한 알고리즘인 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
2 |
2
제1항에 있어서,상기 데이터 분석 모듈은,상기 형태소 분석 데이터를 저장하는 분산 파일 시스템;상기 분산 파일 시스템에 존재하는 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하는 데이터 처리부; 및상기 데이터 처리부가 제공하는 가상화 데이터베이스 인터페이스를 통해 통계분석 알고리즘을 실행하여, 상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출현 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 통계 분석부를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
3 |
3
제2항에 있어서,상기 통계 분석부는,상기 통계 분석부는 상기 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수에 기초하여 단어 별 출현 빈도수 증가율을 산출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
4 |
4
제3항에 있어서,상기 통계 분석부는,상기 연도별 출현빈도수(instance frequencies)를 연도별 문서수로 나누어 문서당 상기 단어들의 연도별 출현 빈도수를 표준화하여 상기 단어들에 대한 표준화된 단어 별 출현 빈도수 증가율을 산출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
5 |
5
제4항에 있어서,상기 통계 분석부는,단어-단어 간 동시 출현 건수 매트릭스를 이용하여 단어 별 연결 정도 중심성 증가율을 산출하고, 상기 표준화된 단어 별 출현 빈도수 증가율 및 상기 연결 정도 중심성 증가율이 상위 일정 부분 이상인 단어 또는 하위 일정 부분 이하인 단어를 위크시그널로 도출하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
6 |
6
제1항에 있어서,상기 데이터 수집 모듈은,이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 시스템
|
7 |
7
(A) 데이터 수집 모듈이 기 설정된 수집 기준에 따라 네트워크를 통해 빅데이터를 수집하여 저장하는 단계;(B) 형태소 분석 모듈이 상기 빅데이터의 형태소를 분석하여 형태소 별로 구분하고 형태소 분석 데이터를 생성하는 단계;(C) 데이터 분석 모듈이 상기 형태소 분석 데이터를 SQL(structured query language)을 기반으로 처리할 수 있도록 가상화 데이터베이스 인터페이스를 제공하고, 상기 가상화 데이터베이스 인터페이스를 통해 상기 형태소 분석 데이터를 분산 병렬 처리 기반의 통계분석 알고리즘으로 처리하여 통계값을 산출하는 단계; 및(D) 상기 데이터 분석 모듈이 상기 통계값에 따라 위크시그널을 출력하는 단계를 포함하되, 상기 통계 분석 알고리즘은 기술 및 시장 예측 모형에 활용되는 지표를 산출하기 위한 알고리즘인 것을 특징으로 빅데이터 분석 기반의 위크시그널 도출 방법
|
8 |
8
제7항에 있어서,상기 (A) 단계는,수집 관리 모듈이 수집 대상 데이터 소스 모듈, 수집 대상 키워드 및 수집 대상 기간 중 적어도 어느 하나의 수집 기준을 설정하는 단계를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법
|
9 |
9
제7항에 있어서,상기 (A) 단계는,상기 데이터 수집 모듈이, 이미지, 동영상, 음성, 센서, GPS, GIS, M2M 데이터 중 적어도 어느 하나의 비정형 데이터를 포함하는 빅데이터를 수집하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법
|
10 |
10
제7항에 있어서,상기 (C) 단계는,상기 형태소 분석 데이터로부터 연도별 출현빈도수(instance frequencies), 연도별 단어-단어 간 동시 출현 건수, 연도별 출현빈도수 및 연도별 단어-단어 간 동시 출현 건수로부터 가공된 값들 중 적어도 하나 이상을 산출하는 단계를 포함하는 것을 특징으로 하는 빅데이터 분석 기반의 위크시그널 도출 방법
|