1 |
1
개념 및 인스턴스 분류 대상에 해당되는 말뭉치 내의 각 용어에 관하여, 상기 용어에 관한 한글표제어 정보, 상기 용어에 대응되는 대역어인 영어표제어 정보 및 상기 용어에 관한 한글뜻풀이 정보를 상기 각 용어별로 입력받는 입력부;
상기 입력부로부터 입력받은 상기 한글표제어 정보, 상기 영어표제어 정보, 상기 한글뜻풀이 정보를 분석하여, 각 정보가 개념 속성 또는 인스턴스 속성을 갖는지의 여부를 상기 각 용어별로 판별하여, 상기 개념 속성인 경우 개념 설정코드를 부가하고 상기 인스턴스 속성인 경우 인스턴스 설정코드를 부가하는 판별부; 및
상기 각 용어별 상기 각 정보에 관하여 상기 개념 설정코드가 부가된 갯수와 상기 인스턴스 설정코드가 부가된 갯수를 비교하는 것에 의해 해당 용어가 개념 또는 인스턴스인지를 판단하여, 상기 각 용어를 개념 또는 인스턴스인 것으로 분류하는 분류부를 포함하는 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
|
2 |
2
제 1항에 있어서, 상기 판별부는,
상기 용어에 관한 개념 속성의 판단을 위한 세 가지 규칙으로서,
상기 용어에 관한 상기 한글표제어 정보가 이미 구축된 다른 온톨로지 정보 상에서 개념으로 분류되어 있는 경우, 상기 한글표제어 정보에 관하여 상기 개념 설정코드를 부가하고,
상기 용어의 대역어인 상기 영어표제어 정보의 첫째 알파벳이 소문자인 경우 상기 한글표제어 정보에 관하여 상기 개념 설정코드를 부가하고,
상기 용어의 한글뜻풀이 정보에 포함된 한글뜻풀이의 어구에 '총칭', '전체', '개념', '집합', '등이', '아우르는' 또는 '단위' 중 선택된 하나 또는 복수 개의 어휘를 포함하는 경우, 상기 한글뜻풀이 정보에 관하여 상기 선택된 하나 또는 복수 개의 각 어휘에 대응되도록 각 어휘별로 상기 개념 설정코드를 개별적으로 부가하는 것을 특징으로 하는 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
|
3 |
3
제 1항 또는 제 2항에 있어서, 상기 판별부는,
상기 용어에 관한 인스턴스 속성의 판단을 위한 세 가지 규칙으로서,
상기 용어에 관한 상기 한글표제어 정보가 이미 구축된 다른 온톨로지 정보 상에서 인스턴스로 분류되어 있는 경우, 상기 한글표제어 정보에 숫자가 포함된 경우, 상기 한글표제어 정보에 영문자가 포함된 경우, 또는 상기 한글표제어 정보가 기 구축된 온톨로지 정보 상의 파생어 또는 합성어 군에 속하는 경우, 해당되는 각 경우 별로 인스턴스 설정코드를 개별적으로 부가하고,
상기 용어의 대역어인 상기 영어표제어 정보의 첫째 알파벳이 대문자인 경우 상기 한글표제어 정보에 관하여 상기 인스턴스 설정코드를 부가하고,
상기 용어의 한글뜻풀이 정보에 포함된 한글뜻풀이의 어구에 고유명사가 포함된 경우, 상기 어구에 숫자가 포함된 경우, 또는 상기 어구에 영문자가 포함된 경우, 해당되는 각 경우별로 상기 인스턴스 설정코드를 개별적으로 부가하는 것을 특징으로 하는 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
|
4 |
4
제 3항에 있어서, 상기 분류부는,
해당 용어의 각 정보에 관하여 상기 개념 설정코드가 부가되는 경우 음(-)의 가중치를 부가하고, 상기 인스턴스 설정코드가 부가되는 경우 양(+)의 가중치를 부가하여, 상기 음(-)의 가중치와 양(+)의 가중치를 합산하여 음수가 나오는 경우에는 해당 용어는 개념이고, 양수가 나오는 경우에는 해당 용어는 인스턴스인 것으로 분류하는 것을 특징으로 하는 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
|
5 |
5
제 4항에 있어서,
상기 각 용어별로 상기 한글표제어 정보, 상기 영어표제어 정보 및 상기 한글뜻풀이 정보를 표시하고, 상기 분류부에 의해 상기 각 용어가 상기 개념 또는 상기 인스턴스로 분류되었는지의 여부가 확인되도록 상기 각 용어별로 개념 또는 인스턴스 분류 내역을 표시 제공하는 표시부를 더 포함하는 것을 특징으로 하는 온톨로지 자동 구축을 위한 개념 및 인스턴스 분류 시스템
|