1 |
1
소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 감정 분석 장치에서 수행되는 POS(part of speech) 특징(feature) 기반의 감정 분석 방법에 있어서, 소셜 네트워크 서비스(SNS) 메시지내 문장들(sentences)의 적어도 하나의 문장을 훈련 데이터 셋(training data set)으로 선택하는 단계;상기 선택된 훈련 데이터셋 내의 문장 중에서 감정적 특징에 기초하여 상기 감정적 특징과 관련이 낮거나 관련이 없는 문장은 상기 훈련 데이터 셋에서 제거하는 단계;상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 POS 태깅 규칙(tagging rule)에 따라 태깅하여 특징 집합(feature set)으로 그룹화하는 단계;상기 그룹화된(clustered) 특징 집합(feature set)의 종속성(dependency)을 기반으로 상기 선택된 훈련 데이터셋에 포함된 문장내의 단어들에 대하여 가중치(weight)를 할당하는 단계; 및상기 훈련 데이터셋에 포함된 문장을 양수와 음수의 적어도 2가지 극성을 가진 클래스(class)로 그룹화하는 단계-여기서, 상기 훈련 데이터셋에 포함된 문장을 상기 극성에 따라 긍정적 문장과 부정적 문장으로 분류됨- 를 포함하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
2 |
2
제1항에 있어서, 상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 POS 태깅 규칙(tagging rule)에 따라 태깅하여 특징 집합(feature set)으로 그룹화하는 단계는상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 명사, 동사, 형용사 및 부사 중 하나의 태그(tag)를 할당하는 단계를 포함하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
3 |
3
제2항에 있어서, 상기 훈련 데이터셋에 포함된 문장이 상기 감정적 특징과 관련이 낮거나 관련이 없는 문장인지를 결정할 때 상기 부사, 형용사 및 동사 중 적어도 하나의 유형을 포함하는 경우 감정적 특징과 관련이 있는 문장으로 간주하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
4 |
4
제3항에 있어서, 상기 훈련 데이터셋에 포함된 문장 중에서 상기 부사, 형용사 및 동사 중 두 가지 이하의 유형을 포함하는 문장은 상기 감정적 특징과 관련이 낮거나 관련이 없는 문장으로 간주하여 상기 훈련 데이터셋에서 제외하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
5 |
5
제3항에 있어서, 상기 훈련 데이터셋에 포함된 문장 중에서 상기 감정적 특징을 가진 단어의 개수가 소정 개수 보다 적은 문장은 상기 훈련 데이터셋에서 제외하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
6 |
6
제1항에 있어서, 단어 식별성(word discrimination; WD)은 단어와 관련하여 얼마나 많은 차별 정보가 있는지를 측정하는 데 사용되며, 높은 단어 식별성(word discrimination; WD)의 단어는 상기 훈련 데이터셋에 포함된 문장의 상기 감정적 특징과 관련이 낮거나 관련이 없는지 판단시 높은 가중치를 할당하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
7 |
7
제1항에 있어서, 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대한 가중치 할당은 단어의 중요성에 따라 할당되는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
8 |
8
제1항에 있어서, 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대한 가중치 할당은 카이 스퀘어(Chi Square) 값으로 측정된 클래스와 함께 상기 그룹화된(clustered) 특징 집합(feature set)의 종속성(dependency)을 고려하며 카이 스퀘어(Chi Square) 값이 클수록 상기 특징 집합의 종속성이 강해지는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
9 |
9
제8항에 있어서, 상기 특징 집합의 종속성을 측정하기 위해 카이 스퀘어(Chi Square)의 임계값 CV을 사용하며, 주어진 카이 스퀘어(Chi Square) 값이 상기 임계값 CV보다 큰 경우, 테스트된 그룹화된 특징 집합은 클래스에 종속된 것으로 간주되는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
10 |
10
제8항에 있어서, 상기 특징 집합의 종속성을 측정하기 위해 카이 스퀘어(Chi Square)의 임계값 CV을 사용하며, 주어진 카이 스퀘어(Chi Square) 값이 상기 임계값 CV보다 작거나 같은 경우, 테스트된 그룹화된 특징 집합은 서로 독립적으로 간주되며, 상기 서로 독립적으로 간주되는 경우 상기 종속성의 신뢰성을 보장하기 위해 상기 임계값 CV가 높게 설정되는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
11 |
11
제1항에 있어서, 더 정확한 예측을 위해 상기 감정적인 특징을 가진 단어에 다른 단어들보다 더 많은 가중치를 할당함으로써 상기 감정적인 특징을 가진 단어의 영향력을 강화하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 위한 POS(part of speech) 특징(feature) 기반의 감정 분석 방법
|
12 |
12
적어도 하나의 명령어를 저장하는 메모리; 및 상기 메모리와 연결되는 프로세서를 포함하고, 상기 프로세서는, 상기 적어도 하나의 명령어를 실행함으로써, 소셜 네트워크 서비스(SNS) 메시지내 문장들(sentences)의 적어도 하나의 문장을 훈련 데이터 셋(training data set)으로 선택하고, 상기 훈련 데이터셋으로 선택된 문장을 감정적 특징에 기초하여 상기 감정적 특징과 관련없는 문장은 상기 훈련 데이터셋에서 제거하고, 상기 훈련 데이터셋에 포함된 문장을 양수와 음수의 2가지 극성을 가진 클래스(class)로 그룹화하고-상기 훈련 데이터셋에 포함된 문장을 상기 극성에 따라 긍정적 문장과 부정적 문장으로 분류됨-, 상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 POS(part of speech) 태그(tag)를 사용하여 분류하여 특징 집합으로 그룹화하고, 상기 그룹화된(clustered) 특징 집합(feature set)의 종속성(dependency)을 기반으로 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대하여 가중치(weight)를 할당하는, 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
13 |
13
제12항에 있어서, 상기 프로세서는 상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 명사, 동사, 형용사 및 부사 중 하나의 태그(tag)를 할당하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
14 |
14
제13항에 있어서, 상기 프로세서는 상기 훈련 데이터셋에 포함된 문장이 상기 감정적 특징과 관련이 낮거나 관련이 없는 문장인지를 결정할 때 상기 부사, 형용사 및 동사 중 적어도 하나의 유형을 포함하는 경우 감정적 특징과 관련이 있는 문장으로 간주하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
15 |
15
제14항에 있어서, 상기 훈련 데이터셋에 포함된 문장 중에서 상기 부사, 형용사 및 동사 중 두 가지 이하의 유형을 포함하는 문장이거나, 상기 훈련 데이터셋에 포함된 문장 중에서 상기 감정적 특징을 가진 단어의 개수가 소정 개수 보다 적은 문장은 상기 감정적 특징과 관련이 낮거나 관련이 없는 문장으로 간주하여 상기 훈련 데이터셋에서 제외하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
16 |
16
제12항에 있어서, 단어 식별성(word discrimination; WD)은 단어와 관련하여 얼마나 많은 차별 정보가 있는지를 측정하는 데 사용되며, 높은 단어 식별성(word discrimination; WD)의 단어는 상기 훈련 데이터셋에 포함된 문장의 상기 감정적 특징과 관련이 낮거나 관련이 없는지 판단시 높은 가중치를 할당하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
17 |
17
제12항에 있어서, 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대한 가중치 할당은 단어의 중요성에 따라 할당되는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
18 |
18
제12항에 있어서, 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대한 가중치 할당은 카이 스퀘어(Chi Square) 값으로 측정된 클래스와 함께 상기 그룹화된(clustered) 특징 집합(feature set)의 종속성(dependency)을 고려하며 카이 스퀘어(Chi Square) 값이 클수록 상기 특징 집합의 종속성이 강해지는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
19 |
19
제12항에 있어서, 더 정확한 예측을 위해 상기 감정적인 특징을 가진 단어에 다른 단어들보다 더 많은 가중치를 할당함으로써 상기 감정적인 특징을 가진 단어의 영향력을 강화하는 것을 특징으로하는 소셜 네트워크 서비스(SNS) 메시지의 감정 분석을 수행하는 감정 분석 장치
|
20 |
20
프로세서 실행 가능한 명령어들을 포함하는 컴퓨터 판독 가능한 저장 매체로서, 상기 명령어들은 상기 프로세서에 의해 실행되었을 때 상기 프로세서로 하여금, 소셜 네트워크 서비스(SNS) 메시지내 문장들(sentences)의 적어도 하나의 문장을 훈련 데이터 셋(training data set)으로 선택하고, 상기 훈련 데이터셋으로 선택된 문장을 감정적 특징에 기초하여 상기 감정적 특징과 관련없는 문장은 상기 훈련 데이터셋에서 제거하고, 상기 훈련 데이터셋에 포함된 문장을 양수와 음수의 2가지 극성을 가진 클래스(class)로 그룹화하고-상기 훈련 데이터셋에 포함된 문장을 상기 극성에 따라 긍정적 문장과 부정적 문장으로 분류됨-, 상기 훈련 데이터셋에 포함된 문장내의 단어들(words)을 POS(part of speech) 태그(tag)를 사용하여 분류하여 특징 집합으로 그룹화하고, 상기 그룹화된(clustered) 특징 집합(feature set)의 종속성(dependency)을 기반으로 상기 훈련 데이터셋에 포함된 문장내의 단어들에 대하여 가중치(weight)를 할당하도록 구성된, 컴퓨터 판독 가능한 저장 매체
|