1 |
1
다의어 지식 데이터베이스를 문장 유사도를 기반으로 확장하는 장치로서, 상기 다의어 지식 데이터베이스에 포함된 다의어의 의미별 용례를 추가하여 확장하기를 원하는 단어인 확장대상 단어를 선정하고, 상기 확장대상 단어가 포함되어 있는 적어도 하나의 문서를 수집하며, 상기 수집된 문서에서 상기 확장대상 단어가 포함된 확장대상 문장만을 추출하는 문서 수집부;상기 다의어 지식 데이터베이스에 상기 확장대상 단어의 의미별 용례를 추가하기 위한 문장 유사도 계산에 사용되는 다중 의미를 지닌 단어(이하, '다의어 분석대상 단어'라 함)를 선정하고, 상기 다의어 분석대상 단어의 의미별 용례 및 상기 적어도 하나의 확장대상 문장에 대하여 형태소 분석을 수행하며, 상기 수행된 형태소 분석 결과에 따라 상기 다의어 분석대상 단어의 의미별 용례와 상기 확장대상 문장을 비교하여 유사도를 계산하고, 상기 계산 결과에 따라 다의어 의미를 분류하는 다의어 인식부;상기 분류된 다의어 의미에 대한 신뢰도를 계산하고, 상기 계산된 신뢰도를 미리 설정된 임계 값과 비교하여 상기 확장대상 문장이 다의어 의미의 용례로 사용될 수 있을지 여부를 검증하여 상기 확장대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 다의어 검증부; 및 상기 확정된 다의어 의미에 대한 용례로 상기 확장대상 문장을 다의어 데이터베이스에 추가하는 데이터베이스 확장부를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
2 |
2
제 1 항에 있어서 상기 문서 수집부는,자동 또는 수동으로 용례의 확장을 원하는 단어를 선정하는 확장대상 단어 선정부;상기 선정된 확장대상 단어가 포함된 문서를 검색하는 문서 검색부; 및상기 검색된 문서로부터 상기 확장대상 단어가 포함된 확장대상 문장을 추출하는 확장대상 문장 추출부를 더 포함하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
3 |
3
제 2 항에 있어서 상기 확장대상 문장 추출부는,상기 검색된 문서 중 상기 확장대상 단어가 포함된 문장만을 남기고 다른 부분은 삭제하여 확장대상 문장을 추출하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
4 |
4
제 1 항에 있어서 상기 다의어 인식부는,다의어 분석을 위해 상기 확장대상 단어와 동일 또는 상이한 다의어 분석대상 단어를 선정하는 다의어 분석대상 단어 선정부;상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 단위로 분석을 수행하는 형태소 분석부;상기 분석된 다의어 의미 별 용례들과 확장대상 문장을 비교하여 유사도를 계산하는 다의어 문장 유사도 계산부; 및상기 계산된 유사도의 계산결과에 따라 상기 다의어 분석대상 단어의 의미 별 용례 중 가장 유사도가 높은 용례를 선정하여 다의어 의미를 분류하는 다의어 의미 분류부를 더 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
5 |
5
제 4 항에 있어서 상기 다의어 문장 유사도 계산부는,단어/형태소 일치 개수 측정방법, 문장 구조 유사도 측정방법, 벡터 근접도 측정방법 중 적어도 하나의 방법으로 유사도를 계산하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
6 |
6
제 5 항에 있어서 상기 다의어 문장 유사도 계산부는 상기 단어/형태소 일치 개수 측정방법, 상기 문장 구조 유사도 측정방법, 상기 벡터 근접도 측정방법 중 상이한 둘 이상을 사용하여 복수의 계산단계를 수행하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
7 |
7
제 1 항에 있어서 상기 다의어 검증부는,상기 분류된 다의어 의미의 신뢰도를 계산하는 다의어 의미 분류 신뢰도 계산부;상기 계산된 신뢰도가 미리 설정된 임계 값보다 큰 경우 대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 신뢰도 자동 검증부; 및상기 계산된 신뢰도가 미리 설정된 임계 값보다 작은 경우 사용자의 선택에 따라 대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 신뢰도 수동 검증부를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장장치
|
8 |
8
다의어 지식 데이터베이스를 문장 유사도를 기반으로 확장하는 방법으로서, 상기 다의어 지식 데이터베이스에 포함된 다의어의 의미별 용례를 추가하여 확장하기를 원하는 단어인 확장대상 단어를 선정하고, 상기 확장대상 단어가 포함되어 있는 적어도 하나의 문서를 수집하며, 상기 수집된 문서에서 상기 확장대상 단어가 포함된 확장대상 문장만을 추출하는 단계;상기 다의어 지식 데이터베이스에 상기 확장대상 단어의 의미별 용례를 추가하기 위한 문장 유사도 계산에 사용되는 다중 의미를 지닌 단어(이하, '다의어 분석대상 단어'라 함)를 선정하고, 상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 분석을 수행하며, 상기 수행된 형태소 분석 결과에 따라 상기 다의어 분석대상 단어의 의미별 용례와 상기 확장대상 문장을 비교하여 유사도를 계산하고, 상기 계산 결과에 따라 다의어 의미를 분류하는 단계;상기 분류된 다의어 의미에 대한 신뢰도를 계산하고, 상기 계산된 신뢰도를 미리 설정된 임계 값과 비교하여 상기 확장대상 문장이 다의어 의미의 용례로 사용될 수 있을지 여부를 검증하여 상기 확장대상 문장이 용례로 사용될 수 있는 다의어 의미를 확정하는 단계; 및상기 확정된 다의어 의미의 용례로 상기 확장대상 문장을 데이터베이스에 추가하는 단계를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
9 |
9
제 8 항에 있어서 상기 확장대상 문장만을 추출하는 단계,자동 또는 수동으로 용례의 확장을 원하는 단어를 선정하는 단계;상기 선정된 확장대상 단어가 포함된 문서를 검색하는 단계; 및상기 검색된 문서로부터 상기 확장대상 단어가 포함된 확장대상 문장을 추출하는 단계를 더 포함하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
10 |
10
제 9 항에 있어서 상기 확장대상 문장을 추출하는 단계는,상기 검색된 문서 중 상기 확장대상 단어가 포함된 문장만을 남기고 다른 부분은 삭제하여 확장대상 문장을 추출하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
11 |
11
제 8 항에 있어서 상기 다의어 의미를 분류하는 단계는,다의어 분석을 위해 상기 확장대상 단어와 동일 또는 상이한 다의어 분석대상 단어를 선정하는 단계;상기 다의어 분석대상 단어의 의미 별 용례 및 적어도 하나의 상기 확장대상 문장에 대하여 형태소 단위로 분석을 수행하는 단계;상기 분석된 다의어 분석대상 단어의 의미 별 용례들과 확장대상 문장을 비교하여 유사도를 계산하는 단계; 및상기 계산된 유사도의 계산결과에 따라 상기 다의어 분석대상 단어의 의미 별 용례 중 가장 유사도가 높은 용례를 선정하여 다의어 의미를 분류하는 단계를 더 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
12 |
12
제 11 항에 있어서 상기 유사도를 계산하는 단계는,단어/형태소 일치 개수 측정방법, 문장 구조 유사도 측정방법, 벡터 근접도 측정방법 중 적어도 하나의 방법으로 유사도를 계산하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
13 |
13
제 12 항에 있어서 상기 유사도를 계산하는 단계는 상기 단어/형태소 일치 개수 측정방법, 상기 문장 구조 유사도 측정방법, 상기 벡터 근접도 측정방법 중 상이한 둘 이상을 사용하여 복수의 계산단계를 수행하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|
14 |
14
제 8 항에 있어서 상기 추가해야 할 용례로 확정하는 단계는,상기 분류된 다의어 의미의 신뢰도를 계산하는 단계;상기 계산된 신뢰도가 미리 설정된 임계 값 보다 큰 경우 대상 문장을 용례로 추가할 다의어 의미를 자동으로 확정하는 단계; 및상기 계산된 신뢰도가 미리 설정된 임계 값 보다 작은 경우 사용자의 선택에 따라 대상 문장을 용례로 추가할 다의어 의미를 확정하는 단계를 포함하는 것을 특징으로 하는 문장 유사도 기반 다의어 데이터베이스 확장방법
|