1 |
1
문서내 텍스트 문자의 형태소에서 감정용어를 추출하여 소정 기준에 따라 분류하는 감정용어 추출부;
상기 감정용어가 속한 감정종류 및 감정 정도에 따라 가중치를 계산하여 상기 문서의 감정정보를 추출하는 가중치 조정부; 및
상기 감정정보를 기초로 상기 감정정보에 대한 감정 벡터의 각도에 대한 값을 이용하여 상기 문서와 대상 문서와의 유사도를 산출하는 유사도 산정부를 포함하는, 감정정보 추출 장치
|
2 |
2
삭제
|
3 |
3
제 1항에 있어서,
상기 텍스트 문자에서 상기 형태소를 추출하는 형태소 분석부를 더 포함하는, 감정정보 추출 장치
|
4 |
4
제 3항에 있어서,
상기 감정정보를 메타데이터로 생성하는 문서 생성부를 더 포함하는, 감정정보 추출 장치
|
5 |
5
형태소 분석부에서, 문서내 텍스트 문자에서 형태소를 추출하는 (a)단계;
감정용어 추출부에서, 상기 형태소에서 감정용어를 추출하여 소정 기준에 따라 분류하는 (b)단계;
가중치 조정부에서, 상기 감정용어가 속한 감정종류 및 감정 정도에 따라 가중치를 계산하여 상기 문서의 감정정보를 추출하는 (c)단계; 및
유사도 산정부에서, 상기 감정정보를 기초로 상기 감정정보에 대한 감정 벡터의 각도에 대한 값을 이용하여 상기 문서와 대상 문서와의 유사도를 산출하는 (d)단계를 포함하는, 감정정보 추출 방법
|
6 |
6
제 5항에 있어서, 상기 가중치(Wij)는
수식에 따라 구해지고, 상기 수식에서 egafreqij, egbfreqij, 및 egcfreqij는 문서 j에 있어서 소정 감정용어 분류 기준에 따라 분류된 감정용어에 대해서 감정종류 i의 소정 감정 정도에 속하는 감정용어의 빈도수를 의미하고, egatotalfreqij, egbtotalfreqij, 및 egctotalfreqij은 소정 감정용어 분류 기준에 따라 분류된 감정용어에 대해서 감정종류 i의 소정 감정 정도에 속하는 미리 정의된 감정용어의 빈도수를 의미하고, Wa, Wb, 및 Wc는 각각 감정 정도에 따른 가중치를 의미하고, i및 j는 각각 1003c#=i003c#=6, 1003c#=j003c#=n로 정의되는, 감정정보 추출 방법
|
7 |
7
삭제
|
8 |
8
제 5항에 있어서, 상기 유사도는
수식에 따라 구해지고, 상기 수식에서 EQ는 상기 문서, ED는 상기 대상 문서를 의미하는, 감정정보 추출 방법
|
9 |
9
제 5항에 있어서, 상기 유사도는
수식에 따라 구해지고, 상기 수식에서 EQ는 상기 문서, ED는 상기 대상 문서를 의미하는, 감정정보 추출 방법
|
10 |
10
제 8항 또는 제 9항에 있어서,
상기 EQ는 의 감정 벡터로 정의되고, 상기 감정 벡터의 W1j 내지 W6j은 감정용어가 속한 감정종류 및 감정정도에 따른 가중치를 의미하는, 감정정보 추출 방법
|