1 |
1
질병 확산 상황 예측 장치에 있어서,질병 통계 서버가 제공하는 기설정된 질병에 대한 의사 환자 분율 데이터를 수집하여 저장하는 질병 통계 자료 수집부;소셜 네트워크 서비스(SNS, Social Network Service) 서버가 제공하는 원본 SNS 데이터를 수집하여 저장하는 SNS 자료 수집부;상기 저장된 SNS 데이터로부터 상기 질병과 관련된 기설정된 기준 단어 중 적어도 하나가 포함된 유효 SNS 데이터를 추출하는 유효 데이터 추출부;상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 의사 환자 분율 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 마커 선별부; 기설정된 기간의 상기 저장된 SNS 데이터로부터 상기 마커의 사용 횟수 및 상기 기설정된 기간의 상기 저장된 SNS 데이터의 총 개수를 포함하는 마커 매트릭스를 생성하는 마커 매트릭스 생성부; 상기 마커 매트릭스를 이용하여 상기 저장된 SNS 데이터 내에서의 상기 마커의 사용 비율을 산출하고, 상기 마커의 사용 비율 및 상기 의사 환자 분율 데이터에 기초하여 예측 목표일에 대응하는 질병 확산 예측 값을 산출하는 질병 확산 예측부; 및 상기 산출된 질병 확산 예측 값에 기초한 질병 확산 정보를 생성하여 제공하는 질병 확산 정보 제공부를 포함하는, 질병 확산 상황 예측 장치
|
2 |
2
제 1 항에 있어서,상기 마커 선별부는,상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 의사 환자 분율 데이터에 대해 LASSO(Least-Absolute Shrinkage And Selection Operator) 분석을 수행하고,상기 LASSO 분석을 통해 산출된 상기 유효 SNS 데이터에 포함된 단어 별 상관 계수에 기초하여 상기 마커를 결정하는 질병 확산 상황 예측 장치
|
3 |
3
제 1 항에 있어서,상기 마커 선별부는,상기 유효 SNS 데이터의 단어 별로 기본형을 판단하여, 상기 기본형 별 총 사용 횟수를 상기 단어 사용 빈도로 산출하는, 질병 확산 상황 예측 장치
|
4 |
4
제 1 항에 있어서,상기 질병 확산 예측부는,상기 기설정된 기간의 상기 저장된 SNS 데이터에 대한 상기 마커의 총 사용 횟수 및 상기 기설정된 기간의 상기 저장된 SNS 데이터의 총 개수에 기초하여 마커 사용 비율 값을 산출하고, 상기 마커 사용 비율 값 및 상기 의사 환자 분율 데이터에 대해 선형 회귀(linear regression) 분석을 수행하여 상기 질병 확산 예측 값을 산출하는, 질병 확산 상황 예측 장치
|
5 |
5
제 4 항에 있어서,상기 질병 확산 예측부는,기설정된 제 1 기간의 상기 저장된 SNS 데이터 및 상기 의사 환자 분율 데이터를 상기 제 1 기간 이전의 제 2 기간의 데이터로서 중복 사용하여 상기 선형 회귀 분석을 수행하는, 질병 확산 상황 예측 장치
|
6 |
6
제 1 항에 있어서,상기 SNS 자료 수집부는,상기 원본 SNS 데이터 중 기설정된 추출 조건을 만족하는 SNS 데이터를 선별하여 수집하되,상기 추출 조건은,기설정된 특정 언어의 사용, 하이퍼링크(hyper link)의 불포함, 기설정된 스팸(SPAM) 단어의 불포함, 및 SNS 계정 별로 계정 사용자 이외의 사용자에 의해 작성된 데이터 불포함 중 적어도 하나를 포함하는 것인, 질병 확산 상황 예측 장치
|
7 |
7
제 1 항에 있어서,상기 유효 데이터 추출부는,상기 원본 SNS 데이터 중 상기 기준 단어와 관련하여 기설정된 안부성 문장 또는 구 또는 단어를 포함하는 SNS 데이터의 제거, 및 상기 기준 단어와의 동음이의어를 포함하는 SNS 데이터의 제거 중 적어도 하나의 제거를 처리하는, 질병 확산 상황 예측 장치
|
8 |
8
제 1 항에 있어서,상기 질병 확산 정보 제공부는,상기 질병 확산 예측 값의 날짜 별 변화를 그래프 형태로 출력하는 질병 확산 상황 예측 장치
|
9 |
9
질병 확산 상황 예측 장치를 통한 질병 확산 상황 예측 방법에 있어서,(a) 소셜 네트워크 서비스(SNS, Social Network Service) 서버가 제공하는 원본 SNS 데이터 및 질병 통계 서버가 제공하는 기설정된 질병에 대한 의사 환자 분율 데이터를 각각 수집하여 저장하는 단계;(b) 상기 저장된 SNS 데이터로부터 질병과 관련된 기설정된 기준 단어 중 적어도 하나를 포함하는 유효 SNS 데이터를 추출하는 단계;(c) 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도와 상기 의사 환자 분율 데이터와의 상관도에 기초하여 상기 유효 SNS 데이터의 단어들로부터 마커를 결정하는 단계;(d) 기설정된 기간 단위 내의 상기 저장된 SNS 데이터 내에서의 상기 마커의 사용 비율 값을 산출하는 단계; 및(e) 상기 마커의 사용 비율 값 및 상기 의사 환자 분율 데이터에 대해 선형 회귀(linear regression) 분석 처리하여 예측 목표일에 대응하는 질병 확산 예측 값을 산출하는 단계; 및(f) 상기 산출된 질병 확산 예측 값에 기초한 질병 확산 정보를 생성하여 사용자 단말에 제공하는 단계를 포함하는 질병 확산 상황 예측 방법
|
10 |
10
제 9 항에 있어서,상기 (c) 단계는,(c-1) 상기 유효 SNS 데이터에 포함된 단어 별 사용 빈도를 산출하는 단계;(c-2) 상기 단어 별 사용 빈도와 상기 의사 환자 분율 데이터에 대해 LASSO(Least-Absolute Shrinkage And Selection Operator) 분석 처리하는 단계; 및(c-3) 상기 LASSO 분석 처리의 결과 산출된 상기 유효 SNS 데이터에 포함된 단어 별 상관 계수에 기초하여 상기 마커를 결정하는 단계를 포함하는, 질병 확산 상황 예측 방법
|
11 |
11
제 9 항에 있어서,상기 (d) 단계는,기설정된 기간 단위 내의 상기 저장된 SNS 데이터에 대한 상기 마커의 총 사용 횟수 및 상기 저장된 SNS 데이터의 총 개수에 기초하여 마커 사용 비율 값을 산출하는, 질병 확산 상황 예측 방법
|
12 |
12
제 9 항에 있어서,상기 (d) 단계 이전에,상기 기설정된 기간의 상기 저장된 SNS 데이터로부터 상기 마커의 사용 횟수 및 상기 기설정된 기간의 상기 저장된 SNS 데이터의 총 개수를 포함하는 마커 매트릭스를 생성하는 단계를 더 포함하되,상기 (d) 단계는,상기 마커 매트릭스를 이용하여 상기 마커의 사용 비율 값을 산출하는, 질병 확산 상황 예측 방법
|
13 |
13
제 9 항에 있어서,상기 (a) 단계는,상기 원본 SNS 데이터 중 기설정된 특정 언어의 사용, 하이퍼링크(hyper link)의 불포함, 기설정된 스팸(SPAM) 단어의 불포함, 및 SNS 계정 별로 계정 사용자 이외의 사용자에 의해 작성된 데이터 불포함 중 적어도 하나의 조건을 만족하는 SNS 데이터를 수집하는, 질병 확산 상황 예측 방법
|
14 |
14
제 9 항에 있어서,상기 (b) 단계는,상기 원본 SNS 데이터 중 상기 기준 단어와 관련하여 기설정된 안부성 문장 또는 구 또는 단어를 포함하는 SNS 데이터의 제거, 및 상기 기준 단어와의 동음이의어를 포함하는 SNS 데이터의 제거 중 적어도 하나의 제거를 처리하여 상기 유효 SNS 데이터를 추출하는, 질병 확산 상황 예측 방법
|
15 |
15
제 9 항에 있어서,상기 (f) 단계는,상기 질병 확산 예측 값의 날짜 별 변화를 그래프 형태로 출력하는 질병 확산 상황 예측 방법
|