1 |
1
전자메일의 속성 헤더(header) 내의 적어도 하나의 헤더 필드 정보를 분석하고, 상기 적어도 하나의 헤더 필드 정보의 IP로부터 상기 전자메일의 저자(authorship)와 관련된 적어도 하나의 특징점 필드 정보를 추출하는 정보 분석부;상기 특징점 필드 정보를 학습 모델의 입력을 위한 특징점 데이터 셋으로 변환하는 정보 변환부; 및상기 특징점 데이터 셋에 대하여 학습을 수행하여 상기 전자메일을 저자별로 분류하기 위한 분류 모델을 생성하는 학습 모델부를 포함하고,상기 정보 분석부는,상기 특징점 필드 정보를 지역(Location) 정보, 언어(Language) 정보, 시간(Time) 정보 및 시스템(System) 정보로 분류하면서,상기 지역 정보 내의 국가(Country), 위도(Latitude), 경도(Longitude), 타임존(Timezone) 중 적어도 하나로 상기 특징점 필드 정보를 분류하거나,상기 언어 정보 내의 압축 방식(Encoding), 지원 언어(Accept-Language), 콘텐트 언어(Content-Language), 문자-셋(Charset) 중 적어도 하나로 상기 특징점 필드 정보를 분류하거나,상기 시간 정보 내의 날짜(Date), 주(Weekdays/Weekend), 업무 시간(Official hours), 변동 타입(Shift type) 중 적어도 하나로 상기 특징점 필드 정보를 분류하며,상기 학습 모델부는,상기 특징점 데이터 셋을 n개의 샘플링 데이터로 분할하는 샘플링부;상기 n개의 샘플링 데이터 각각에 대해 학습 알고리즘을 적용하여 n개의 분류기 데이터를 생성하는 학습 및 분류부; 및상기 n개의 분류기 데이터를 결합하여 상기 분류 모델을 생성하는 모델 결합부를 포함하는전자메일 저자 분류 장치
|
2 |
2
삭제
|
3 |
3
제 1 항에 있어서,상기 정보 변환부는,상기 특징점 필드 정보를 범주형(Categorical) 또는 수치형(Numerical)으로 변환하여 상기 특징점 데이터 셋을 생성하는전자메일 저자 분류 장치
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
제 1 항에 있어서,상기 학습 알고리즘은, 배깅(Bagging) 분류 알고리즘을 포함하는전자메일 저자 분류 장치
|
7 |
7
제 1 항에 있어서,임의의 전자메일에 상기 분류 모델을 적용하여 상기 임의의 전자메일의 저자를 분류하는 저자 분류기를 더 포함하는전자메일 저자 분류 장치
|
8 |
8
전자메일의 속성 헤더 내의 적어도 하나의 헤더 필드 정보를 분석하는 단계;상기 적어도 하나의 헤더 필드 정보의 IP로부터 상기 전자메일의 저자와 관련된 적어도 하나의 특징점 필드 정보를 추출하는 단계;상기 특징점 필드 정보를 학습 모델의 입력을 위한 특징점 데이터 셋으로 변환하는 단계; 및상기 특징점 데이터 셋에 대하여 학습을 수행하여 상기 전자메일을 저자별로 분류하기 위한 분류 모델을 생성하는 단계를 포함하고,상기 추출하는 단계는,상기 특징점 필드 정보를 지역 정보, 언어 정보, 시간 정보 및 시스템 정보로 분류하면서,상기 지역 정보 내의 국가, 위도, 경도, 타임-존 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 언어 정보 내의 압축 방식, 지원 언어, 콘텐트 언어, 문자-셋 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 시간 정보 내의 날, 주, 업무 시간, 변동 타입 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계를 포함하며,상기 생성하는 단계는,상기 특징점 데이터 셋을 n개의 샘플링 데이터로 분할하는 단계;상기 n개의 샘플링 데이터 각각에 대해 학습 알고리즘을 적용하여 n개의 분류기 데이터를 생성하는 단계; 및상기 n개의 분류기 데이터를 결합하여 상기 분류 모델을 생성하는 단계를 포함하는전자메일 저자 분류를 위한 학습 장치의 학습 방법
|
9 |
9
삭제
|
10 |
10
제 8 항에 있어서,상기 변환하는 단계는,상기 특징점 필드 정보를 범주형 또는 수치형으로 변환하여 상기 특징점 데이터 셋을 생성하는전자메일 저자 분류를 위한 학습 장치의 학습 방법
|
11 |
11
삭제
|
12 |
12
삭제
|
13 |
13
제 8 항에 있어서,상기 학습 알고리즘은, 배깅 분류 알고리즘을 포함하는전자메일 저자 분류를 위한 학습 장치의 학습 방법
|
14 |
14
전자메일의 속성 헤더 내의 적어도 하나의 헤더 필드 정보를 분석하는 단계;상기 적어도 하나의 헤더 필드 정보의 IP로부터 상기 전자메일의 저자와 관련된 적어도 하나의 특징점 필드 정보를 추출하는 단계;상기 특징점 필드 정보를 학습 모델의 입력을 위한 특징점 데이터 셋으로 변환하는 단계;상기 특징점 데이터 셋에 대하여 학습을 수행하여 상기 전자메일을 저자별로 분류하기 위한 분류 모델을 생성하는 단계; 및임의의 전자메일에 상기 분류 모델을 적용하여 상기 임의의 전자메일의 저자를 분류하는 단계를 포함하고,상기 추출하는 단계는,상기 특징점 필드 정보를 지역 정보, 언어 정보, 시간 정보 및 시스템 정보로 분류하면서,상기 지역 정보 내의 국가, 위도, 경도, 타임-존 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 언어 정보 내의 압축 방식, 지원 언어, 콘텐트 언어, 문자-셋 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 시간 정보 내의 날, 주, 업무 시간, 변동 타입 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계를 포함하며,상기 생성하는 단계는,상기 특징점 데이터 셋을 n개의 샘플링 데이터로 분할하는 단계;상기 n개의 샘플링 데이터 각각에 대해 학습 알고리즘을 적용하여 n개의 분류기 데이터를 생성하는 단계; 및상기 n개의 분류기 데이터를 결합하여 상기 분류 모델을 생성하는 단계를 포함하는전자메일 저자 분류 방법
|
15 |
15
전자메일의 속성 헤더 내의 적어도 하나의 헤더 필드 정보를 분석하는 단계;상기 적어도 하나의 헤더 필드 정보의 IP로부터 상기 전자메일의 저자와 관련된 적어도 하나의 특징점 필드 정보를 추출하는 단계;상기 특징점 필드 정보를 학습 모델의 입력을 위한 특징점 데이터 셋으로 변환하는 단계;상기 특징점 데이터 셋에 대하여 학습을 수행하여 상기 전자메일을 저자별로 분류하기 위한 분류 모델을 생성하는 단계; 및임의의 전자메일에 상기 분류 모델을 적용하여 상기 임의의 전자메일의 저자를 분류하는 단계를 포함하고,상기 추출하는 단계는,상기 특징점 필드 정보를 지역 정보, 언어 정보, 시간 정보 및 시스템 정보로 분류하면서,상기 지역 정보 내의 국가, 위도, 경도, 타임-존 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 언어 정보 내의 압축 방식, 지원 언어, 콘텐트 언어, 문자-셋 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 시간 정보 내의 날, 주, 업무 시간, 변동 타입 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계를 포함하며,상기 생성하는 단계는,상기 특징점 데이터 셋을 n개의 샘플링 데이터로 분할하는 단계;상기 n개의 샘플링 데이터 각각에 대해 학습 알고리즘을 적용하여 n개의 분류기 데이터를 생성하는 단계; 및상기 n개의 분류기 데이터를 결합하여 상기 분류 모델을 생성하는 단계를 포함하는명령어를 포함하는 프로그램이 기록된 컴퓨터 판독 가능 기록 매체
|
16 |
16
전자메일의 속성 헤더 내의 적어도 하나의 헤더 필드 정보를 분석하는 단계;상기 적어도 하나의 헤더 필드 정보의 IP로부터 상기 전자메일의 저자와 관련된 적어도 하나의 특징점 필드 정보를 추출하는 단계;상기 특징점 필드 정보를 학습 모델의 입력을 위한 특징점 데이터 셋으로 변환하는 단계;상기 특징점 데이터 셋에 대하여 학습을 수행하여 상기 전자메일을 저자별로 분류하기 위한 분류 모델을 생성하는 단계; 및임의의 전자메일에 상기 분류 모델을 적용하여 상기 임의의 전자메일의 저자를 분류하는 단계를 포함하고,상기 추출하는 단계는,상기 특징점 필드 정보를 지역 정보, 언어 정보, 시간 정보 및 시스템 정보로 분류하면서,상기 지역 정보 내의 국가, 위도, 경도, 타임-존 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 언어 정보 내의 압축 방식, 지원 언어, 콘텐트 언어, 문자-셋 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계;상기 시간 정보 내의 날, 주, 업무 시간, 변동 타입 중 적어도 하나로 상기 특징점 필드 정보를 분류하는 단계를 포함하며,상기 생성하는 단계는,상기 특징점 데이터 셋을 n개의 샘플링 데이터로 분할하는 단계;상기 n개의 샘플링 데이터 각각에 대해 학습 알고리즘을 적용하여 n개의 분류기 데이터를 생성하는 단계; 및상기 n개의 분류기 데이터를 결합하여 상기 분류 모델을 생성하는 단계를 포함하는컴퓨터 판독 가능 기록 매체에 저장된 컴퓨터 프로그램
|