1 |
1
개체명 사전 구축부가, 비정형 개인정보를 수록한 개체명 사전을 구축하는 단계;학습 데이터 구축부가, 상기 개체명 사전의 표제어 및 사용자 입력 단어중에서 하나 이상을 검색대상으로 하는 개체명 검색 결과를 확인하여 데이터 특성별로 하나 이상의 스니펫을 추출하는 단계; 상기 학습 데이터 구축부가, 상기 추출한 스니펫에 해당 개체명을 태깅하여 개체명 학습 데이터를 확보하는 단계;학습 모델 결정부가, 상기 확보된 개체명 학습 데이터를 기반으로 비정형 개인정보 개체명 인식을 위한 학습 모델을 결정하는 단계; 및개체명 인식부가, 대상 문서를 입력받게 됨에 따라 상기 개체명 사전과 상기 결정된 학습 모델을 이용하여 해당 대상 문서 내에 있는 비정형 개인정보인 개체명을 자동으로 탐지하여 태깅한 문서를 출력하는 단계;를 포함하는 것을 특징으로 하는 개체명 인식 방법
|
2 |
2
청구항 1에 있어서,상기 학습 모델을 결정하는 단계는, 상기 확보된 개체명 학습 데이터를 복수의 학습 모델에 적용하여 각각의 학습 모델별 신뢰 점수를 확인하는 단계; 및상기 각각의 학습 모델별 신뢰 점수를 확인하는 단계의 결과를 근거로 어느 한 학습 모델을 비정형 개인정보 개체명 인식을 위한 학습 모델로 결정하는 단계;를 포함하는 것을 특징으로 하는 개체명 인식 방법
|
3 |
3
청구항 2에 있어서,상기 복수의 학습 모델은 CRF 학습 모델, SVM 학습 모델, 및 HMM 학습 모델을 포함하는 것을 특징으로 하는 개체명 인식 방법
|
4 |
4
청구항 1에 있어서,상기 태깅한 문서를 출력하는 단계는,상기 대상 문서를 입력받게 됨에 따라 상기 개체명 사전의 표제어들과 상기 학습 모델을 결정하는 단계에 의해 결정된 상기 학습 모델을 근거로 상기 대상 문서에서 개체명 검색을 수행하는 단계; 및상기 검색된 개체명들을 태깅하여 개체명 태깅 문서를 생성하여 출력하는 단계;를 포함하는 것을 특징으로 하는 개체명 인식 방법
|
5 |
5
청구항 1에 있어서,상기 개체명 학습 데이터를 확보하는 단계는 상기 하나 이상의 스니펫을 추출하는 단계에서 추출된 하나 이상의 스니펫에서 오류가 없는 스니펫에 해당 개체명을 태깅하는 것을 특징으로 하는 개체명 인식 방법
|
6 |
6
청구항 1에 있어서,상기 하나 이상의 스니펫을 추출하는 단계는,상기 개체명 사전에 수록된 표제어를 기반으로 검색 엔진을 통해 해당 스니펫을 확보하는 단계; 및상기 사용자 입력 단어를 키워드로 하여 검색 엔진을 통해 해당 스니펫을 확보하는 단계;를 포함하는 것을 특징으로 하는 개체명 인식 방법
|
7 |
7
청구항 1에 있어서, 상기 개체명 사전은 기업명 리스트를 기반으로 확보된 사전 표제어, 및 웹 포털사이트의 검색 순위상 단어를 기반으로 확보한 사전 표제어를 수록하는 것을 특징으로 하는 개체명 인식 방법
|
8 |
8
삭제
|
9 |
9
삭제
|
10 |
10
삭제
|
11 |
11
삭제
|
12 |
12
비정형 개인정보를 수록한 개체명 사전을 구축하는 개체명 사전 구축부;상기 개체명 사전의 표제어 및 사용자 입력 단어중에서 하나 이상을 검색대상으로 하는 개체명 검색 결과를 확인하여 데이터 특성별로 하나 이상의 스니펫을 추출하고, 상기 추출한 스니펫에 해당 개체명을 태깅하여 개체명 학습 데이터를 확보하는 학습 데이터 구축부;상기 확보된 개체명 학습 데이터를 기반으로 비정형 개인정보 개체명 인식을 위한 학습 모델을 결정하는 학습 모델 결정부; 및대상 문서를 입력받게 됨에 따라 상기 개체명 사전과 상기 결정된 학습 모델을 이용하여 해당 대상 문서 내에 있는 비정형 개인정보인 개체명을 자동으로 탐지하여 태깅한 문서를 출력하는 개체명 인식부;를 포함하는 것을 특징으로 하는 개체명 인식 장치
|
13 |
13
청구항 12에 있어서,상기 학습 모델 결정부는, 상기 확보된 개체명 학습 데이터를 복수의 학습 모델에 적용하여 각각의 학습 모델별 신뢰 점수를 확인하여 어느 한 학습 모델을 비정형 개인정보 개체명 인식을 위한 학습 모델로 결정하는 것을 특징으로 하는 개체명 인식 장치
|
14 |
14
청구항 13에 있어서,상기 복수의 학습 모델은 CRF 학습 모델, SVM 학습 모델, 및 HMM 학습 모델을 포함하는 것을 특징으로 하는 개체명 인식 장치
|
15 |
15
청구항 12에 있어서,상기 개체명 인식부는,상기 대상 문서를 입력받게 됨에 따라 상기 개체명 사전의 표제어들과 상기 학습 모델 결정부에서 결정된 상기 학습 모델을 근거로 상기 대상 문서에서 개체명 검색을 수행하고, 상기 검색된 개체명들을 태깅하여 개체명 태깅 문서를 생성하여 출력하는 것을 특징으로 하는 개체명 인식 장치
|
16 |
16
청구항 12에 있어서,상기 학습 데이터 구축부는 상기 추출된 하나 이상의 스니펫에서 오류가 없는 스니펫에 해당 개체명을 태깅하는 것을 특징으로 하는 개체명 인식 장치
|
17 |
17
청구항 12에 있어서,상기 학습 데이터 구축부는 상기 개체명 사전에 수록된 표제어를 기반으로 검색 엔진을 통해 해당 스니펫을 확보하고, 상기 사용자 입력 단어를 키워드로 하여 검색 엔진을 통해 해당 스니펫을 확보하는 것을 특징으로 하는 개체명 인식 장치
|
18 |
18
청구항 12에 있어서,상기 개체명 사전은 기업명 리스트를 기반으로 확보된 사전 표제어, 및 웹 포털사이트의 검색 순위상 단어를 기반으로 확보한 사전 표제어를 수록하는 것을 특징으로 하는 개체명 인식 장치
|