1 |
1
적어도 하나의 문서의 감정 근거를 추출하는 방법에 있어서,상기 문서 내의 단어를 기반으로 초기 염색체 집합을 임의로 생성하는 단계 - 여기서, 염색체의 각 유전자의 속성은 상기 문서 내의 훈련 데이터 셋에서 나타나는 각 단어들을 의미하고, 속성 값은 단어의 선택 여부를 나타냄 - ;상기 초기 염색체 집합을 대상으로, 평가 함수 - 평가 함수는 문서의 극성을 분류하는 정확도를 최대화하는 함수 - 를 통해 각 염색체를 평가하는 단계;각 염색체의 평가 점수를 기반으로 유전자 연산을 거쳐 새로운 염색체를 생성하는 단계;상기 생성된 염색체가 종료 조건을 만족하는지 판단하여 감정 근거 집합을 생성하는 단계를 포함하는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
2 |
2
제 1 항에 있어서, 상기 생성된 염색체가 종료 조건을 만족하는지 판단하여 감정 근거 집합을 생성하는 단계는상기 생성된 염색체가 상기 종료 조건을 만족하는지 판단하는 단계; 및상기 종료 조건을 만족하는 경우, 감정 근거 집합에 포함시키고, 상기 종료 조건을 만족하지 못하는 경우, 상기 염색체 평가 단계 및 상기 새로운 염색체 생성 단계를 반복 수행한 후, 종료 조건 만족 여부를 다시 판단하는 과정을 반복 수행하는 단계를 포함하는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
3 |
3
제 1 항에 있어서, 상기 훈련 데이터 셋에서 나타나는 각 단어들은 대상 문서와 감성 사전 데이터에서 모두 나타나는 단어들이며, 상기 감성 사전 데이터에 따라 긍정(positive) 또는 부정(negative) 점수를 갖는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
4 |
4
제 1 항에 있어서,상기 초기 염색체 집합 내의 각 염색체는 후보 감정 근거 단어들의 선택 여부를 나타내는 바이너리 스트링(binary string)으로 표현되는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
5 |
5
제 4 항에 있어서, 각 염색체의 평가 함수를 기반으로 유전자 연산을 거쳐 새로운 염색체를 생성하는 단계는,상기 염색체 집합 내의 복수 개의 염색체 바이너리 스트링들을 대상으로, 소정 인접한 스트링 쌍들을 토너먼트 선택(tournament selection) - 토너먼트 선택시 평가 점수를 고려함 - 에 기반하여 교배를 위해 선택하는 단계;상기 선택된 스트링 쌍을 가지고, 소정 교배 포인트에서 서브스트링들을 교환함으로써 단일-포인트 교배를 수행하는 단계; 및변이 확률 상수에 기반하여 교배를 수행한 스트링 내의 개별 속성 값을 변이시키는 단계를 포함하는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
6 |
6
제 1 항에 있어서, 상기 종료 조건은 유전자 연산을 통해 생성되는 염색체의 평가 점수의 변화량이 수렴하는 형태를 갖는지 여부를 통해 결정되는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
7 |
7
제 1 항에 있어서, 상기 평가 점수는 문서의 극성을 식별하기 위해, 긍정 감성 지수 - 상기 훈련 데이터 셋의 긍정 점수를 합산한 값임 - 및 부정 감성 지수 - 상기 훈련 데이터 셋의 부정 점수를 합산한 값임 - 사이의 차이 값을 기반으로 산출되는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
8 |
8
제 1 항에 있어서, 상기 평가 점수는, 상기 생성된 감정 근거 집합을 이용하여 전체 문서들의 수 대비 정확하게 분류된 문서들의 수의 비율; 상기 생성된 감정 근거 집합을 이용하여 긍정으로 분류된 문서 중 정확하게 긍정인 문서들의 수의 비율; 및상기 생성된 감정 근거 집합을 이용하여 부정으로 분류된 문서 중 정확하게 부정인 문서들의 수의 비율 중 적어도 하나를 기반으로 계산되는 것을 특징으로 하는 문서의 감정 근거 추출 방법
|
9 |
9
적어도 하나의 문서의 감정 근거를 추출하는 장치에 있어서,상기 문서 내의 단어를 기반으로 초기 염색체 집합을 임의로 생성하는 염색체 집합 생성부 - 여기서, 염색체의 각 유전자의 속성은 상기 문서 내의 훈련 데이터 셋에서 나타나는 각 단어들을 의미하고, 속성 값은 단어의 선택 여부를 나타냄 - ;상기 초기 염색체 집합을 대상으로, 평가 함수 - 평가 함수는 문서의 극성을 분류하는 정확도를 최대화하는 함수 - 를 통해 각 염색체를 평가하는 평가부;각 염색체의 평가 점수를 기반으로 유전자 연산을 거쳐 새로운 염색체를 생성하는 유전자 연산부;상기 생성된 염색체가 종료 조건을 만족하는지 판단하여 감정 근거 집합을 생성하는 감정 근거 집합 생성부를 포함하는 것을 특징으로 하는 문서의 감정 근거 추출 장치
|
10 |
10
적어도 하나의 문서의 감정 근거를 추출하여 감성 분석을 수행하는 방법에 있어서,상기 문서 내의 단어를 기반으로 초기 염색체 집합을 임의로 생성하는 단계 - 여기서, 염색체의 각 유전자의 속성은 상기 문서 내의 훈련 데이터 셋에서 나타나는 각 단어들을 의미하고, 속성 값은 단어의 선택 여부를 나타냄 - ;상기 초기 염색체 집합을 대상으로, 평가 함수 - 평가 함수는 문서의 극성을 분류하는 정확도를 최대화하는 함수 - 를 통해 각 염색체를 평가하는 단계;각 염색체의 평가 점수를 기반으로 유전자 연산을 거쳐 새로운 염색체를 생성하는 단계;상기 생성된 염색체가 종료 조건을 만족하는지 판단하여 감정 근거 집합을 생성하는 단계; 및상기 생성된 감정 근거 집합을 이용하여 테스트 대상 문서의 감성 분류를 수행하는 단계를 포함하는 것을 특징으로 하는 문서에 대한 감성 분석 방법
|
11 |
11
제 10 항에 있어서, 상기 감성 분류 수행 단계는,상기 생성된 감정 근거 집합을 이용하여 평가를 위한 감성 분석 정확도를 문서들의 수 대비 정확하게 분류된 문서들의 수의 비율을 통해 계산하는 단계를 포함하는 것을 특징으로 하는 문서에 대한 감성 분석 방법
|
12 |
12
제 10 항에 있어서, 상기 감성 분류 수행 단계는,상기 테스트 대상 문서에 포함된, 감정 근거 집합 단어들을 기반으로 긍정 감성 지수 및 부정 감성 지수를 산출하여 더 높은 값을 갖는 감성을 해당 테스트 대상 문서의 감성으로 분류하는 단계를 포함하는 것을 특징으로 하는 문서에 대한 감성 분석 방법
|
13 |
13
적어도 하나의 문서의 감정 근거를 추출하여 감성 분석을 수행하는 장치에 있어서,상기 문서 내의 단어를 기반으로 초기 염색체 집합을 임의로 생성하고, - 여기서, 염색체의 각 유전자의 속성은 상기 문서 내의 훈련 데이터 셋에서 나타나는 각 단어들을 의미하고, 속성 값은 단어의 선택 여부를 나타냄 - 상기 초기 염색체 집합을 대상으로, 평가 함수 - 평가 함수는 문서의 극성을 분류하는 정확도를 최대화하는 함수 - 를 통해 각 염색체를 평가하여, 각 염색체의 평가 점수를 기반으로 유전자 연산을 거쳐 새로운 염색체를 생성하고 상기 생성된 염색체가 종료 조건을 만족하는지 판단하여 감정 근거 집합을 생성하는 감정 근거 집합 생성부; 및상기 생성된 감정 근거 집합을 이용하여 테스트 대상 문서의 감성 분류를 수행하는 감성 분류부를 포함하는 것을 특징으로 하는 문서에 대한 감성 분석 장치
|