1 |
1
통신망을 통해 수집되는 데이터에 대한 감성분석을 위한 방법에 있어서,감성단어사전를 이용하여 상기 수집되는 데이터가 레이블 - 레이블은 극성정보를 나타냄 - 이 있는 데이터와 레이블이 없는 데이터로 분류하는 단계;상기 레이블이 있는 데이터를 기반으로 기계학습방식을 통해 감성분석 모델을 생성하는 단계;상기 생성된 감성분석모델을 이용하여 상기 레이블이 없는 데이터의 레이블을 예측하는 단계를 포함하되, 상기 레이블 예측 단계는,상기 감성분석 모델의 분류경계로부터의 상기 레이블이 없는 데이터의 이격 거리와 임계값과의 비교를 통해 상기 레이블이 없는 데이터의 레이블을 예측하는 단계를 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
2 |
2
제 1 항에 있어서, 상기 레이블 예측 단계를 통해 새롭게 레이블이 예측된 데이터는 감성분석 모델 생성의 추가 기초 데이터로 이용되고, 종료 조건이 만족될 때까지 상기 감성분석 모델 생성 단계 및 상기 레이블 예측 단계가 반복 수행되는 것을 특징으로 하는 데이터 감성분석 방법
|
3 |
3
제 2 항에 있어서,상기 종료 조건은 레이블이 있는 데이터의 개수가 더이상 늘어나지 않는 조건을 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
4 |
4
제 1 항에 있어서,상기 기계학습 방식은 서포트 벡터 머신(Support Vector Machine) 기법을 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
5 |
5
제 4 항에 있어서, 상기 감성분석 모델 생성 단계는상기 서포트 벡터 머신 기법을 이용하여, 레이블이 있는 데이터를 특징 벡터로 2개 집단으로 분리시키는 초평면(Hyperplane)을 생성하는 단계를 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
6 |
6
제 5 항에 있어서, 상기 레이블 예측 단계는상기 레이블이 없는 데이터 중 상기 초평면의 분류경계로부터 소정 임계거리보다 멀리 이격하여 위치해 있는 데이터의 현재 평면 상의 위치를 기반으로 레이블을 예측하는 단계를 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
7 |
7
제 1 항에 있어서,상기 수집되는 데이터를 단어 단위로 분리하는 단계; 및상기 분리된 단어에 포함된 특수 문자, URL 및 불용어를 제외시키는 단계를 더 포함하는 것을 특징으로 하는 데이터 감성분석 방법
|
8 |
8
통신망을 통해 수집되는 데이터에 대한 감성분석을 위한 장치에 있어서,감성단어사전를 이용하여 상기 수집되는 데이터가 레이블 - 레이블은 극성정보를 나타냄 - 이 있는 데이터와 레이블이 없는 데이터로 분류하는 분류부;상기 레이블이 있는 데이터를 기반으로 기계학습방식을 통해 감성분석 모델을 생성하는 감성분석 모델 생성부; 및상기 생성된 감성분석모델을 이용하여 상기 레이블이 없는 데이터의 레이블을 예측하는 레이블 예측부를 포함하되, 상기 레이블 예측부는,상기 감성분석 모델의 분류경계로부터의 상기 레이블이 없는 데이터의 이격 거리와 임계값과의 비교를 통해 상기 레이블이 없는 데이터의 레이블을 예측하는 것을 특징으로 하는 데이터 감성분석 장치
|
9 |
9
제 8 항에 있어서, 상기 레이블 예측부를 통해 새롭게 레이블이 예측된 데이터는 감성분석 모델 생성의 추가 기초 데이터로 이용되고, 종료 조건이 만족될 때까지 감성분석 모델 생성 및 레이블 예측을 반복 수행하는 것을 특징으로 하는 데이터 감성분석 장치
|
10 |
10
제 9 항에 있어서,상기 종료 조건은 레이블이 있는 데이터의 개수가 더이상 늘어나지 않는 조건을 포함하는 것을 특징으로 하는 데이터 감성분석 장치
|
11 |
11
제 8 항에 있어서,상기 기계학습 방식은 서포트 벡터 머신(Support Vector Machine) 기법을 포함하는 것을 특징으로 하는 데이터 감성분석 장치
|
12 |
12
제 11 항에 있어서, 상기 감성분석 모델 생성부는상기 서포트 벡터 머신 기법을 이용하여, 레이블이 있는 데이터를 특징 벡터로 2개 집단으로 분리시키는 초평면(Hyperplane)을 생성하는 것을 특징으로 하는 데이터 감성분석 장치
|
13 |
13
제 12 항에 있어서, 상기 레이블 예측부는상기 레이블이 없는 데이터 중 상기 초평면의 분류경계로부터 소정 임계거리보다 멀리 이격하여 위치해 있는 데이터의 현재 평면 상의 위치를 기반으로 레이블을 예측하는 것을 특징으로 하는 데이터 감성분석 장치
|
14 |
14
제 8 항에 있어서,상기 수집되는 데이터를 단어 단위로 분리하는 단어 분리부; 및상기 분리된 단어에 포함된 특수 문자, URL 및 불용어를 제외시키는 불용어 제외부를 더 포함하는 것을 특징으로 하는 데이터 감성분석 장치
|
15 |
15
통신망을 통해 수집되는 데이터에 대한 감성분석을 위한 시스템에 있어서,온라인 상에서 발생하는 수집 데이터를 게시하는 복수의 웹 서버; 및감성단어사전를 이용하여 상기 수집되는 데이터가 레이블 - 레이블은 극성정보를 나타냄 - 이 있는 데이터와 레이블이 없는 데이터로 분류하고, 상기 레이블이 있는 데이터를 기반으로 기계학습방식을 통해 감성분석 모델을 생성하며, 상기 생성된 감성분석모델을 이용하여 상기 레이블이 없는 데이터의 레이블을 예측하되, 상기 감성분석 모델의 분류경계로부터의 상기 레이블이 없는 데이터의 이격 거리와 임계값과의 비교를 통해 상기 레이블이 없는 데이터의 레이블을 예측하는 감성분석 장치를 포함하는 것을 특징으로 하는 데이터 감성분석 시스템
|
16 |
16
통신망을 통해 수집되는 데이터에 대한 감성분석을 위한 프로그램이 기록된 컴퓨터 판독가능한 기록 매체에 있어서,감성단어사전를 이용하여 상기 수집되는 데이터가 레이블 - 레이블은 극성정보를 나타냄 - 이 있는 데이터와 레이블이 없는 데이터로 분류하는 단계;상기 레이블이 있는 데이터를 기반으로 기계학습방식을 통해 감성분석 모델을 생성하는 단계;상기 생성된 감성분석모델을 이용하여 상기 레이블이 없는 데이터의 레이블을 예측하는 단계를 포함하되, 상기 레이블 예측 단계는,상기 감성분석 모델의 분류경계로부터의 상기 레이블이 없는 데이터의 이격 거리와 임계값과의 비교를 통해 상기 레이블이 없는 데이터의 레이블을 예측하는 단계를 구현하는 명령어를 포함하는 것을 특징으로 하는 데이터 감성분석을 구현하는 프로그램이 기록된 기록 매체
|