1 |
1
입력된 텍스트를 전처리하는 텍스트 전처리부;상기 전처리된 텍스트 중 비표준 의미로 사용될 수 있는 대상 단어를 선정하는 대상 단어 선정부; 및상기 전처리된 텍스트의 전체 문맥이 나타내는 의미를 통합적으로 고려한 통합 벡터를 이용하여 상기 대상 단어가 상기 비표준 의미로 사용되었는지 여부를 판단하는 비표준 의미 사용 여부 판단부;를 포함하는, 단어의 비표준 의미 사용 탐지 장치
|
2 |
2
제 1항에 있어서,상기 전체 문맥은 상기 대상 단어 및 상기 대상 단어를 제외한 주변 단어들을 포함하고,상기 비표준 의미 사용 여부 판단부는,상기 주변 단어들 전체의 의미를 통합적으로 표상한 상기 통합 벡터를 산출하는 통합 벡터 산출부; 및상기 대상 단어의 의미를 표상한 대상 벡터와 상기 통합 벡터와의 일치도를 나타내는 제1 표준 의미 점수를 산출하는 제1 표준 의미 점수 산출부;를 포함하는,단어의 비표준 의미 사용 탐지 장치
|
3 |
3
제 2항에 있어서,상기 비표준 의미 사용 여부 판단부는,상기 주변 단어들 중 상기 대상 단어와 소정의 거리 내에 있는 주요 주변 단어를 선정하고, 상기 주요 주변 단어와 관련된 가중치를 이용하여 제2 표준 의미 점수를 산출하는 제2 표준 의미 점수 산출부;를 더 포함하는,단어의 비표준 의미 사용 탐지 장치
|
4 |
4
제 3항에 있어서,상기 제2 표준 의미 점수 산출부는,상기 주요 주변 단어들과 상기 대상 단어 사이의 유사도에 상기 가중치를 부여하여, 상기 제1 표준 의미 점수에 다른 가중치를 부여한 결과와 합산함으로서 상기 제2 표준 의미 점수를 산출하는,단어의 비표준 의미 사용 탐지 장치
|
5 |
5
제 2항에 있어서,상기 통합 벡터 산출부는,상기 주변 단어들 각각의 표준 의미 사용 여부에 따라 각각 상이한 가중치를 부여하여 상기 통합 벡터를 산출하는,단어의 비표준 의미 사용 탐지 장치
|
6 |
6
제 2항 또는 제 3항에 있어서,상기 비표준 의미 사용 여부 판단부는,상기 제1 표준 의미 점수 또는 상기 제2 표준 의미 점수가 소정의 임계치 이상인지 여부를 판단하여, 상기 제1 표준 의미 점수 또는 상기 제2 표준 의미 점수가 상기 임계치 미만인 경우 상기 대상 단어가 상기 비표준 의미로 사용된 것으로 판단하는 임계치 비교판단부;를 더 포함하는,단어의 비표준 의미 사용 탐지 장치
|
7 |
7
제 6항에 있어서, 상기 임계치는 상기 대상 단어의 비표준 의미 사용 여부 정보가 주석화된 정보를 포함하는 훈련 데이터를 참조하여 미리 결정되는,단어의 비표준 의미 사용 탐지 장치
|
8 |
8
제 7항에 있어서,상기 훈련 데이터와 관련된 표준 의미 점수를 오름차순으로 정렬한 ROC(Receiver Operating Characteristic) 곡선 위의 좌표 중 상기 ROC 곡선의 기울기 변화가 최대로 급격해지는 지점에서의 상기 ROC 곡선 위의 최적의 값이 상기 임계치로 결정되는,단어의 비표준 의미 사용 탐지 장치
|
9 |
9
입력된 텍스트를 전처리하는 텍스트 전처리 단계;상기 전처리된 텍스트 중 비표준 의미로 사용될 수 있는 대상 단어를 선정하는 대상 단어 선정 단계; 및상기 전처리된 텍스트의 전체 문맥이 나타내는 의미를 통합적으로 고려한 통합 벡터를 이용하여 상기 대상 단어가 상기 비표준 의미로 사용되었는지 여부를 판단하는 비표준 의미 사용 여부 판단 단계;를 포함하는, 단어의 비표준 의미 사용 탐지 방법
|
10 |
10
제 9항에 있어서,상기 전체 문맥은 상기 대상 단어 및 상기 대상 단어를 제외한 주변 단어들을 포함하고,상기 비표준 의미 사용 여부 판단 단계는,상기 주변 단어들 전체의 의미를 통합적으로 표상한 상기 통합 벡터를 산출하는 통합 벡터 산출 단계; 및상기 대상 단어의 의미를 표상한 대상 벡터와 상기 통합 벡터와의 일치도를 나타내는 제1 표준 의미 점수를 산출하는 제1 표준 의미 점수 산출 단계;를 포함하는,단어의 비표준 의미 사용 탐지 방법
|
11 |
11
제 10항에 있어서,상기 비표준 의미 사용 여부 판단 단계는,상기 주변 단어들 중 상기 대상 단어와 소정의 거리 내에 있는 주요 주변 단어를 선정하고, 상기 주요 주변 단어와 관련된 가중치를 이용하여 제2 표준 의미 점수를 산출하는 제2 표준 의미 점수 산출 단계;를 더 포함하는,단어의 비표준 의미 사용 탐지 방법
|
12 |
12
제 11항에 있어서,상기 제2 표준 의미 점수 산출 단계는,상기 주요 주변 단어들과 상기 대상 단어 사이의 유사도에 상기 가중치를 부여하여, 상기 제1 표준 의미 점수에 다른 가중치를 부여한 결과와 합산함으로서 상기 제2 표준 의미 점수를 산출하는,단어의 비표준 의미 사용 탐지 방법
|
13 |
13
제 10항에 있어서,상기 통합 벡터 산출 단계는,상기 주변 단어들 각각의 표준 의미 사용 여부에 따라 각각 상이한 가중치를 부여하여 상기 통합 벡터를 산출하는,단어의 비표준 의미 사용 탐지 방법
|
14 |
14
제 10항 또는 제 11항에 있어서,상기 비표준 의미 사용 여부 판단 단계는,상기 제1 표준 의미 점수 또는 상기 제2 표준 의미 점수가 소정의 임계치 이상인 지 여부를 판단하여, 상기 제1 표준 의미 점수 또는 상기 제2 표준 의미 점수가 상기 임계치 미만인 경우 상기 대상 단어가 상기 비표준 의미로 사용된 것으로 판단하는 임계치 비교 판단 단계;를 더 포함하는,단어의 비표준 의미 사용 탐지 방법
|
15 |
15
제 14항에 있어서,상기 임계치는 상기 대상 단어의 비표준 의미 사용 여부 정보가 주석화된 정보를 포함하는 훈련 데이터를 참조하여 미리 결정되는,단어의 비표준 의미 사용 탐지 방법
|
16 |
16
제 15항에 있어서,상기 훈련 데이터와 관련된 표준 의미 점수를 오름차순으로 정렬한 ROC(Receiver Operating Characteristic) 곡선 위의 좌표 중 상기 ROC 곡선의 기울기 변화가 최대로 급격해지는 지점에서의 상기 ROC 곡선 위의 최적의 값이 상기 임계치로 결정되는,단어의 비표준 의미 사용 탐지 방법
|
17 |
17
제 9항 내지 제 16항 중 어느 한 항에 따른 방법을 실행하기 위한 컴퓨터 프로그램을 기록하기 위한 컴퓨터 판독 가능한 기록 매체
|