1 |
1
텍스트 내 문자열 및 상기 문자열의 주변 단어들로 구성된 하나 이상의 단어 기반 자질들을 이용한 용례학습기반 알고리즘을 통해 학습 모델을 생성하는 학습부, 그리고상기 학습 모델을 이용하여 사용자 입력 텍스트 내에서 개체 범위를 인식하고, 상기 개체 범위로 인식된 개체 목록을 출력하는 적용부를 포함하는 개체 범위 인식 장치
|
2 |
2
제1항에 있어서,상기 단어 기반 자질들은,상기 텍스트 내 문자열 중 임의의 문자열 자체, 상기 임의의 문자열의 첫 단어와 같은 어절에 있고 상기 임의의 문자열의 앞에 붙은 접두 문자열,상기 임의의 문자열의 마지막 단어와 같은 어절에 있고 상기 임의의 문자열의 뒤에 붙은 접미 문자열, 상기 임의의 문자열 및 상기 접두 문자열상기 임의의 문자열 및 상기 접미 문자열,상기 임의의 문자열 및 상기 임의의 문자열의 바로 앞 어절, 그리고상기 임의의 문자열 및 상기 임의의 문자열의 바로 뒤 어절을 포함하는 개체 범위 인식 장치
|
3 |
3
제1항에 있어서,상기 학습부는,복수의 개체 중에서 일부 개체가 태깅되어 있는 코퍼스 문서 뭉치로부터 개체 후보 문자열들을 추출하는 추출 모듈, 상기 개체 후보 문자열들 별로 각각의 자질값을 계산하는 계산 모듈, 그리고온라인 백과사전 문서 내 모든 개체의 위치 및 URI(Uniform Resource Identifier) 정보를 가진 정답 집합으로 구성된 정답 문서 뭉치에 상기 자질값을 적용하여 상기 정답 문서 뭉치 내 문자열들 별로 각각의 자질값을 획득하고, 상기 각각의 자질값을 기계 학습 알고리즘으로 학습하여 상기 학습 모델을 생성하는 학습 모듈을 포함하는 개체 범위 인식 장치
|
4 |
4
제3항에 있어서,상기 추출 모듈은,일회 이상 개체로 태깅된 적이 있는 모든 문자열을 개체 후보 문자열로 추출하는 개체 범위 인식 장치
|
5 |
5
제3항에 있어서,상기 학습 모듈은,서포트 벡터 머신(SVM, Support Vector Machine) 모델로 학습하는 개체 범위 인식 장치
|
6 |
6
제3항에 있어서,상기 학습부는, 상기 개체 후보 문자열들로 구성된 문자열 사전을 저장하는 문자열 사전 DB, 상기 계산 모듈이 계산한 각각의 자질값을 저장하는 자질값 DB, 그리고상기 학습 모델을 저장하는 학습 모델 DB를 더 포함하고, 상기 적용부는,상기 문자열 사전을 이용하여 사용자 입력 텍스트 내에서 모든 개체 후보를 검출하는 검출 모듈,상기 자질값 DB에 저장된 상기 각각의 자질값 중에서 상기 모든 개체 후보 별로 해당하는 각각의 자질값을 부여하는 자질값 계산 모듈, 그리고상기 모든 개체 후보 별로 해당하는 각각의 자질값과 상기 학습 모델을 이용하여 개체 후보 중에서 개체 범위로 인식된 개체 목록을 추출하는 문자열 범위 인식 모듈을 포함하는 개체 범위 인식 장치
|
7 |
7
제6항에 있어서,상기 각각의 자질값은, 하기 수학식을 통해 산출되는 개체 범위 인식 장치
|
8 |
8
제6항에 있어서, 상기 코퍼스 문서 뭉치, 상기 정답 문서 뭉치 및 상기 사용자 입력 텍스트를 입력받기 위한 입력부, 그리고상기 개체 목록을 출력하는 출력부를 더 포함하는 개체 범위 인식 장치
|
9 |
9
컴퓨팅 기반의 개체 범위 인식 장치가 텍스트 내 문자열 및 상기 문자열의 주변 단어들로 구성된 하나 이상의 단어 기반 자질들을 이용한 용례학습기반 알고리즘을 통해 학습 모델을 생성하는 단계, 그리고상기 학습 모델을 이용하여 사용자 입력 텍스트 내에서 개체 범위를 인식하고, 상기 개체 범위로 인식된 개체 목록을 출력하는 단계를 포함하는 개체 범위 인식 방법
|
10 |
10
제9항에 있어서,상기 생성하는 단계는, 복수의 개체 중에서 일부 개체가 태깅되어 있는 코퍼스 문서 뭉치로부터 개체 후보 문자열들을 추출하는 단계,상기 개체 후보 문자열들 별로 각각의 자질값을 계산하여 저장하는 단계, 그리고온라인 백과사전 문서 내 모든 개체의 위치 및 URI(Uniform Resource Identifier) 정보를 가진 정답 집합으로 구성된 정답 문서 뭉치에 상기 자질값을 적용하여 상기 정답 문서 뭉치 내 문자열들 별로 각각의 자질값을 획득하고, 상기 각각의 자질값을 서포트 벡터 머신(SVM, Support Vector Machine) 모델로 학습하여 상기 학습 모델을 생성하는 단계를 포함하는 개체 범위 인식 방법
|
11 |
11
제10항에 있어서,상기 저장하는 단계는,상기 개체 후보 문자열들이 개체에 해당하는지와, 상기 개체 후보 문자열들이 상기 자질을 만족하는지를 이용한 조건부 확률 계산식에 따라 상기 각각의 자질값을 계산하여 저장하는 개체 범위 인식 방법
|
12 |
12
제10항에 있어서,상기 추출하는 단계는,일회 이상 개체로 태깅된 적이 있는 모든 문자열을 개체 후보 문자열로 추출하는 단계, 그리고상기 개체 후보 문자열로 구성된 문자열 사전을 생성하여 저장하는 단계를 포함하는 개체 범위 인식 방법
|
13 |
13
제12항에 있어서,상기 출력하는 단계는,사용자 입력 테스트를 입력받는 단계,상기 문자열 사전을 이용하여 상기 사용자 입력 텍스트 내에서 모든 개체 후보를 검출하는 단계,상기 개체 후보 단여열들에 부여된 각각의 자질값을 이용하여 상기 모든 개체 후보 별로 해당하는 각각의 자질값을 부여하는 단계, 그리고상기 모든 개체 후보 별로 부여된 해당하는 각각의 자질값과 상기 학습 모델을 이용하여 상기 모든 개체 후보 중에서 개체 범위로 인식된 개체 목록을 추출하는 단계를 포함하는 개체 범위 인식 방법
|