1 |
1
생물의학용어 개체명 인식 시스템이 생물의학용어 개체명을 인식하는 방법으로서,개체 범주로 분리되지 않은 복수의 용어들을 포함하고, 정답 생물의학용어가 태깅되어 있는 언레이블드 데이터인 입력 데이터를 수신하고, 수신한 상기 입력 데이터로부터 적어도 하나의 명사구를 추출하여 기본형으로 변형하며, 기본형으로 변형된 명사구 각각에 대하여 저장된 개체명 범주를 확인하는 단계,,상기 확인한 개체명 범주의 개수를 토대로, 상기 기본형으로 변형된 명사구를 형성하는 어휘 각각에 대응되는 개체명 또는 자동 생성 개체명 중 어느 하나를 태깅하고, 어휘, 상기 어휘에 대응하는 자질 그리고 태깅된 개체명을 포함하는 학습 데이터를 구성하는 단계, 그리고상기 구성한 학습 데이터를 토대로 학습하여, 상기 학습 데이터에서 상기 자동 생성 개체명이 태깅된 어휘에 대한 개체명을 확정하는 단계를 포함하고,상기 학습 데이터는 추출한 어휘에 대한 기본형인 어휘원형, 상기 어휘의 자질, 태깅된 개체명으로 구성되는 생물의학용어 개체명 인식 방법
|
2 |
2
제1항에 있어서,상기 입력 데이터는 적어도 하나의 정답 생물의학용어가 포함되어 있으며, 상기 정답 생물의학용어가 어느 하나의 개체 범주로 분리되지 않은 데이터인 생물의학용어 개체명 인식 방법
|
3 |
3
제2항에 있어서,상기 개체명 범주를 확인하는 단계는,상기 입력 데이터로부터 상기 적어도 하나의 정답 생물의학용어에 대한 명사구를 추출하는 단계, 상기 추출한 명사구 각각을 기본형으로 변형하고, 기본형으로 변형된 명사구 각각에 대해 미리 저장된 개체명 범주를 매칭하는 단계,상기 입력 데이터로부터 어휘를 각각 추출하는 단계, 그리고상기 명사구 및 상기 추출한 어휘에 대한 자질을 확인하는 단계를 포함하는 생물의학용어 개체명 인식 방법
|
4 |
4
제3항에 있어서,상기 학습 데이터를 구성하는 단계는,기본형으로 변형된 명사구에 매칭된 개체명 범주의 수가 하나인지 확인하는 단계,명사구에 매칭된 개체명 범주의 수가 하나이면, 상기 매칭된 개체명 범주를 상기 명사구에 대한 개체명 범주로 결정하는 단계,상기 명사구를 이루는 복수의 어휘에 상기 결정한 개체명 범주에 따른 개체명을 각각 태깅하는 단계, 그리고상기 개체명이 태깅된 어휘가 상기 학습 데이터에 포함되도록 구성하는 단계를 포함하는 생물의학용어 개체명 인식 방법
|
5 |
5
제4항에 있어서,상기 개체명 범주의 수가 하나인지 확인하는 단계는,상기 추출한 명사구 또는 추출한 어휘에 매칭된 개체명 범주의 수가 하나가 아니라면, 상기 추출한 명사구를 구성하는 복수의 어휘 또는 상기 추출한 어휘에 대하여 미리 설정된 정보가 삽입된 자동 생성 개체명을 태깅하는 단계, 그리고상기 자동 생성 개체명을 포함하는 어휘가 상기 학습 데이터에 포함되도록 구성하는 단계를 더 포함하는 생물의학용어 개체명 인식 방법
|
6 |
6
제5항에 있어서,상기 개체명을 확정하는 단계는,상기 학습 데이터의 어휘원형과 자질을 기초로 상기 개체명이 추출되는지 학습하여 새로운 학습 데이터를 생성하는 단계,상기 학습 데이터에서 자동 생성 개체명을 가지는 어휘와 상기 학습하여 생성한 상기 새로운 학습 데이터의 개체명을 비교하는 단계, 상기 새로운 학습 데이터에서 상기 자동 생성 개체명을 가지는 어휘가 특정 개체명으로 확정되어 있으면, 상기 자동 생성 개체명을 상기 확정된 특정 개체명으로 갱신하는 단계, 그리고상기 특정 개체명으로 갱신한 어휘가 포함되도록 학습 데이터를 구성하는 단계를 포함하는 생물의학용어 개체명 인식 방법
|
7 |
7
제6항에 있어서,상기 개체명 범주를 확정하는 단계는 부트스트래핑 기법으로 개체명 태그를 확정하는 생물의학용어 개체명 인식 방법
|
8 |
8
생물의학용어 개체명을 인식하는 시스템으로서,개체 범주로 분리되지 않은 복수의 용어들을 포함하고 정답 생물의학용어가 태깅되어 있는 언레이블드 데이터인 입력 데이터로부터 적어도 하나의 명사구를 추출하여 기본형으로 변형하는 생물의학용어 명사구 인식 모듈,상기 입력 데이터에 포함된 어휘의 자질을 획득하고, 상기 기본형으로 변형된 명사구 각각에 대한 개체명 범주를 획득하고, 상기 획득한 개체명 범주의 개수에 따라 명사구 각각을 구성하는 복수의 어휘에 특정 개체명 또는 자동 생성 개체명 중 어느 하나를 태깅하여, 상기 명사구의 기본형인 어휘원형, 상기 어휘의 자질, 태깅된 개체명을 포함하는 학습 데이터로 생성하는 학습 데이터 생성 모듈, 그리고상기 학습 데이터를 토대로 학습하여, 상기 자동 생성 개체명이 태깅된 어휘의 개체명을 확정하는 개체명 학습 모듈을 포함하는 생물의학용어 개체명 인식 시스템
|
9 |
9
제8항에 있어서,생물의학용어에 대한 개체명 범주 정보가 저장되어 있으며, 상기 학습 데이터 생성 모듈로 상기 명사구에 대한 개체명 범주 정보를 제공하는 개체명 범주 데이터베이스를 포함하며,상기 개체명 범주 데이터베이스는 메타 맵(Metamap)인 생물의학용어 개체명 인식 시스템
|
10 |
10
제8항에 있어서,상기 학습 데이터 생성 모듈은,임의의 명사구에 대한 개체명 범주의 개수가 하나이면 상기 개체명 범주를 상기 명사구를 이루는 복수의 어휘에 대한 개체명으로 확정하여 태깅하고,임의의 명사구에 대한 개체명 범주의 개수가 하나가 아니면, 미리 설정된 정보가 삽입되도록 자동 생성 개체명을 상기 임의의 명사구를 이루는 복수의 어휘에 각각 태깅하는 생물의학용어 개체명 인식 시스템
|
11 |
11
제8항에 있어서,상기 학습 데이터는 추출한 어휘에 대한 어휘원형, 상기 어휘의 자질, 태깅된 개체명으로 구성되고,상기 개체명 학습 모듈은, 상기 학습 데이터의 어휘원형과 자질을 기초로 상기 개체명이 추출되는지 학습하여 새로운 학습 데이터를 생성하고, 상기 학습 데이터에서 자동 생성 개체명이 태깅된 어휘와 상기 새로운 학습 데이터에서 동일한 어휘에 대한 개체명을 비교하며, 자동 생성 개체명을 가지는 어휘가 특정 개체명으로 확정되어 있으면, 상기 자동 생성 개체명을 상기 특정 개체명으로 갱신하는 생물의학용어 개체명 인식 시스템
|
12 |
12
제11항에 있어서,상기 생물의학용어 개체명 인식 모듈은 부트스트래핑 기법으로 개체명 태그를 확정하는 생물의학용어 개체명 인식 시스템
|