1 |
1
인터넷에 게시된 원시 데이터를 기설정된 형식의 데이터 구조로 재구성하는 단계;상기 원시 데이터에서 개인정보를 추출하는 단계;상기 데이터 구조 및 상기 개인정보를 분석하여 자질을 추출하는 단계;상기 자질에 문장 분류 알고리즘을 적용하여 상기 개인정보의 소유자를 예측하는 1차 단계;상기 자질에 소유자 식별 규칙을 적용하여 상기 개인정보의 소유자를 예측하는 2차 단계; 및상기 1차 단계의 예측 값 및 상기 2차 단계의 예측 값을 비교하여 상기 개인정보의 최종 소유자를 식별하는 단계를 포함하는 것을 특징으로 하는 개인정보 소유자 식별 방법
|
2 |
2
청구항 1에 있어서,상기 최종 소유자를 식별하는 단계는상기 1차 단계의 예측 값과 상기 2차 단계의 예측 값이 일치하는 경우에 상기 1차 단계의 예측 값을 이용하여 상기 최종 소유자를 식별하고, 상기 1차 단계의 예측 값과 상기 2차 단계의 예측 값이 일치하지 않는 경우에 상기 2차 단계의 예측 값을 이용하여 상기 최종 소유자를 식별하는 것을 특징으로 하는 개인정보 소유자 식별 방법
|
3 |
3
청구항 1에 있어서,상기 자질을 추출하는 단계는상기 개인정보를 기준으로 좌우에 나타나는 특징이 되는 단어의 존재 유무, 문장의 구조적 특징, 특수 기호의 위치 및 문장의 길이 중 적어도 하나를 분석하여 상기 자질을 추출하는 것을 특징으로 하는 개인정보 소유자 식별 방법
|
4 |
4
청구항 1에 있어서,상기 재구성하는 단계는기설정된 예외단어를 제외한 알파벳, 특수문자 및 이모티콘 중 적어도 하나를 제거하여 상기 원시 데이터를 상기 기설정된 형식의 데이터 구조로 재구성하는 것을 특징으로 하는 개인정보 소유자 식별 방법
|
5 |
5
청구항 1에 있어서,상기 소유자 식별 규칙은사람의 직관적인 방법 및 의사결정트리 중 적어도 하나를 사용하여 생성되는 것을 특징으로 하는 개인정보 소유자 식별 방법
|
6 |
6
인터넷에 게시된 원시 데이터를 기설정된 형식의 데이터 구조로 재구성하는 데이터 정제부;상기 원시 데이터에서 개인정보를 추출하는 개체명 분석부;상기 데이터 구조 및 상기 개인정보를 분석하여 자질을 추출하는 자질 추출부;상기 자질에 문장 분류 알고리즘을 적용하여 상기 개인정보의 소유자를 예측하는 소유자 식별 모델;상기 자질에 소유자 식별 규칙을 적용하여 상기 개인정보의 소유자를 예측하는 자질 규칙 소유자 식별 모델; 및상기 소유자 식별 모델에 의해 예측된 제1 예측 값 및 상기 자질 규칙 소유자 식별 모델에 의해 예측된 제2 예측 값을 비교하여 상기 개인정보의 최종 소유자를 식별하는 소유자 확인부를 포함하는 것을 특징으로 하는 개인정보 소유자 식별 장치
|
7 |
7
청구항 6에 있어서,상기 소유자 확인부는상기 제1 예측 값과 상기 제2 예측 값이 일치하는 경우에 상기 제1 예측 값을 이용하여 상기 최종 소유자를 식별하고, 상기 제1 예측 값과 상기 제2 예측 값이 일치하지 않는 경우에 상기 제2 예측 값을 이용하여 상기 최종 소유자를 식별하는 것을 특징으로 하는 개인정보 소유자 식별 장치
|
8 |
8
청구항 6에 있어서,상기 자질 추출부는상기 개인정보를 기준으로 좌우에 나타나는 특징이 되는 단어의 존재 유무, 문장의 구조적 특징, 특수 기호의 위치 및 문장의 길이 중 적어도 하나를 분석하여 상기 자질을 추출하는 것을 특징으로 하는 개인정보 소유자 식별 장치
|
9 |
9
청구항 6에 있어서,상기 데이터 정제부는기설정된 예외단어를 제외한 알파벳, 특수문자 및 이모티콘 중 적어도 하나를 제거하여 상기 원시 데이터를 상기 기설정된 형식의 데이터 구조로 재구성하는 것을 특징으로 하는 개인정보 소유자 식별 장치
|
10 |
10
청구항 6에 있어서,상기 소유자 식별 규칙은사람의 직관적인 방법 및 의사결정트리 중 적어도 하나를 사용하여 생성되는 것을 특징으로 하는 개인정보 소유자 식별 장치
|