1 |
1
복수의 문서로부터 복수의 문장을 추출하는 단계;상기 복수의 문장의 감정점수를 생성하는 단계;상기 감정점수에 기반하여 상기 복수의 문장 중 적어도 일부를 추출하는 단계; 및상기 추출된 문장을 입력으로 미리 학습된 언어모델(language model)에 적용하여, 적어도 하나의 후보 텍스트(text prediction candidates)를 생성하는 단계;를 포함하는 언어처리방법
|
2 |
2
제1 항에 있어서,상기 복수의 문서는 복수의 도메인으로 설정된 문서를 포함하는 것을 특징으로 하는 언어처리방법
|
3 |
3
제1 항에 있어서,상기 감정점수는 긍정점수, 부정점수, 중립점수, 또는 혼합점수를 포함하는 것을 특징으로 하는 언어처리방법
|
4 |
4
제3 항에 있어서,상기 긍정점수는 +1, 상기 부정점수는 -1, 상기 중립점수는 0의 가중치를 가질 수 있고,상기 혼합점수는 -1 내지 +1 사이의 값을 나타내는 것을 특징으로 하는 언어처리방법
|
5 |
5
제1 항에 있어서,상기 감정점수를 생성하는 단계는,상기 복수의 문장의 센텐스 벡터를 추출하는 단계; 및상기 센텐스 벡터를 미리 학습된 감정모델(emotion model)에 입력으로 적용하여, 상기 감정점수를 생성하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
6 |
6
제1 항에 있어서,상기 복수의 문장 중 적어도 일부를 추출하는 단계는,상기 복수의 문장 각각에 대응되는 감정점수를 비교하여, 인접한 문장 간의 감정점수의 차이가 최대인 구간을 확인하는 단계; 및상기 확인된 구간에 포함된 적어도 둘의 문장을 추출하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
7 |
7
제1 항에 있어서,상기 복수의 문장 중 적어도 일부를 추출하는 단계는,상기 복수의 문장 각각에 대응되는 감정점수를 비교하여, 인접한 문장 간의 감정점수의 차이가 최대인 구간을 확인하는 단계; 및상기 확인된 구간에 포함된 적어도 둘의 문장을 추출하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
8 |
8
제1 항에 있어서,상기 복수의 문장 중 적어도 일부를 추출하는 단계는,상기 복수의 문장 각각에 대응되는 감정점수를 비교하여, 인접한 문장 간의 감정점수의 차이가 미리 설정된 임계값 이상인 적어도 둘의 문장을 추출하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
9 |
9
제1 항에 있어서,상기 복수의 문장을 추출하는 단계는,상기 복수의 문서 중 상기 문서를 구성하는 문장의 수가 미리 설정된 임계치 미만인 제1 문서를 제외하고, 상기 문장의 수가 미리 설정된 임계치 이상인 제2 문서로부터 상기 복수의 문장을 추출하는 것을 특징으로 하는 언어처리방법
|
10 |
10
제9 항에 있어서,상기 미리 설정된 임계치는,상기 언어모델의 입력으로 적용되는 문장의 수에 상응하는 것을 특징으로 하는 언어처리방법
|
11 |
11
제1 항에 있어서,상기 복수의 문서의 도메인을 분류하는 단계;상기 분류된 도메인에 기반하여 적어도 하나의 추가문장을 추출하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
12 |
12
제11 항에 있어서,상기 복수의 문서의 도메인을 분류하는 단계는,상기 복수의 문서를 구성하는 상기 복수의 텍스트로부터 센텐스 벡터를 추출하는 단계;상기 센텐스 벡터를 미리 학습된 분류모델에 적용하여, 상기 복수의 텍스트에 대응하는 하나 이상의 후보 도메인(domaion prediction candidates)를 생성하는 단계;를 포함하는 것을 특징으로 하는 언어처리방법
|
13 |
13
제12 항에 있어서,상기 추가문장을 추출하는 단계는,상기 후보 도메인이 두괄식 문단으로 판단되면, 상기 두괄식 문단의 첫 번째 문장으로부터 순서대로 N 번째(N은 자연수)문장까지의 텍스트를 포함하는 추가 텍스트(additional text)을 추출하는 것을 특징으로 하는 언어처리방법
|
14 |
14
제12 항에 있어서,상기 추가문장을 추출하는 단계는,상기 후보 도메인이 미괄식 문단으로 판단되면, 상기 미괄식 문단의 마지막 문장으로부터 역순으로 M 번째(M은 자연수)문장까지의 텍스트를 포함하는 추가문장을 추출하는 것을 특징으로 하는 언어처리방법
|
15 |
15
제1 항 내지 제14 항 중 어느 한 항의 방법을 컴퓨터 시스템에서 실행하기 위한 프로그램이 기록된 컴퓨터 시스템이 판독 가능한 기록매체
|