1 |
1
정보추출 시스템을 통해 추출된 정보추출 결과를 지식베이스에 저장하기 위한 정규화 방법에 있어서, 상기 정보추출 결과가 기록되는 대상 테이블의 속성에 따라 상기 정보추출 결과에 대한 정규화 방법을 결정하고 이에 대한 우선순위를 결정하는 정규화 방법 및 우선순위 결정 단계; 및상기 결정된 정규화 방법 및 우선순위에 따라 상기 대상 테이블에 기록된 정보추출 결과를 정규화하는 지식 정규화 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
2 |
2
질의응답 시스템에서 지식베이스 검색을 위해 사용하는 검색어의 정규화 방법에 있어서, 상기 검색어의 문자열 속성에 따라 정규화 방법을 결정하고 이에 대한 우선순위를 결정하는 정규화 방법 및 우선순위 결정 단계; 및상기 결정된 정규화 방법 및 우선순위에 따라 상기 검색어 문자열을 정규화하는 지식 정규화 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
3 |
3
제 1항 또는 제 2항에 있어서, 상기 대상 테이블 또는 상기 검색어 문자열이 고유한 의미를 가진 문자열을 포함하는 경우, 상기 대상 테이블 또는 상기 검색어 문자열에 대한 정규화를 생략하는 단계를 더 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
4 |
4
제 1항 또는 제 2항에 있어서, 상기 지식 정규화 단계는,시소러스를 이용한 제 1 정규화 단계, 사전을 이용한 제 2 정규화 단계, 규칙을 이용한 제 3 정규화 단계, 유사 문자열 검색을 이용한 제 4 정규화 단계 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
5 |
5
제 4항에 있어서, 상기 시소러스를 이용한 제 1 정규화 단계는,상기 대상 테이블에 포함된 문자열 또는 상기 검색어 문자열이 입력되면 해당 문자열을 검색키로 하여 상기 시소러스를 검색하는 단계;상기 검색키와 일치하는 문자열이 상기 시소러스에 존재하는 경우, 상기 시소러스에서 해당 문자열에 대한 정규화 문자열을 추출하여 출력하는 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
6 |
6
제 4항에 있어서, 상기 사전을 이용한 제 2 정규화 단계는,상기 대상 테이블에 포함된 문자열 또는 상기 검색어 문자열이 입력되면 검색 사전명 및 사전 검색 방법이 설정되는 단계;상기 입력된 문자열 또는 문자열의 속성을 검색키로 하여 상기 검색 사전을 상기 사전 검색 방법에 따라 검색하는 단계; 및상기 검색키와 일치하는 문자열이 상기 검색 사전에서 검색되면, 상기 검색 사전에서 해당 문자열에 대한 정규화 문자열을 추출하여 출력하는 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
7 |
7
제 6항에 있어서, 상기 검색 사전은,빈번하게 축약되어 표현되는 약어들이 기록되어 있는 약어 사전, 또는 빈번하게 음차 표기되는 어휘들이 기록되어 있는 음차 표기 사전 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
8 |
8
제 6항에 있어서, 상기 사전 검색 방법은,완전 매칭 또는 부분 매칭 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
9 |
9
제 4항에 있어서, 상기 규칙을 이용한 제 3 정규화 단계는,상기 대상 테이블에 포함된 문자열 또는 상기 검색어 문자열이 입력되면 상기 입력된 문자열을 지정된 규칙에 따라 변환하는 단계; 및상기 지정된 규칙에 따른 변환이 성공한 경우 상기 변환된 문자열을 정규화 문자열로 출력하는 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
10 |
10
제 4항에 있어서, 상기 유사 문자열 검색을 이용한 제 4 정규화 단계는,상기 대상 테이블에 포함된 문자열 또는 상기 검색어 문자열이 입력되면 상기 입력된 문자열을 유사 문자열 사전에서 검색하여 상기 입력된 문자열에 대한 후보 문자열들을 생성하는 단계;상기 입력된 문자열과 상기 후보 문자열들 사이의 에디트 디스턴스(edit distance)를 측정하는 단계; 및상기 후보 문자열들 중에서 가장 작은 에디트 디스턴스를 가지는 후보 문자열을 선택하여 이를 정규화 문자열로 출력하는 단계를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 방법
|
11 |
11
입력된 문자열의 속성에 따른 정규화 방법 및 그 우선순위가 기록된 정규화 테이블이 저장되어 있는 메모리부;상기 메모리부의 정규화 테이블에 기록된 정보들을 기반으로 상기 입력된 문자열의 속성에 적합한 정규화가 이루어지도록 제어하는 정규화 제어부; 및상기 정규화 제어부의 제어에 따라 입력된 문자열을 정규화하는 정규화부를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 장치
|
12 |
12
제 11항에 있어서, 상기 메모리부는,용어간의 관계가 기록되어 있는 시소러스;빈번하게 축약되어 표현되는 약어들이 기록되어 있는 약어 사전 DB;빈번하게 음차 표기되는 어휘들이 기록되어 있는 음차 표기 사전 DB;문자열의 규칙적인 패턴이 기록되어 있는 규칙 패턴 DB; 또는명언/속담/격언 문자열이 기록되어 있는 유사 문자열 사전 DB 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 장치
|
13 |
13
제 11항 또는 제 12항에 있어서, 상기 정규화부는,상기 시소러스에서 상기 입력된 문자열에 대한 정규화 문자열을 검색하여 출력하는 시소러스 기반 정규화부;상기 약어 사전 DB 또는 상기 음차 표기 사전 DB에서 상기 입력된 문자열에 대한 정규화 문자열을 검색하여 출력하는 사전 기반 정규화부;상기 규칙 패턴 DB를 기반으로 상기 입력된 문자열을 지정된 규칙에 따라 변환하여 변환된 문자열을 정규화 문자열로 출력하는 규칙 기반 정규화부; 또는상기 유사 문자열 사전 DB를 기반으로 상기 입력된 문자열에 대한 후보 문자열들 중에서 가장 작은 에디트 디스턴스를 가지는 후보 문자열을 정규화 문자열로 출력하는 유사 문자열 기반 정규화부 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 지식베이스 관리를 위한 지식 정규화 장치
|