1 |
1
분석용 팩스 스팸 문서 집단과 분석용 팩스 일반 문서 집단 중 적어도 어느 하나를 토대로 스팸 분류 알고리즘을 생성하는 단계; 상기 스팸 분류 알고리즘을 이용하여 수신된 대상 팩스 문서가 스팸 문서인지 판별하는 판별 단계; 및판별 결과를 기반으로 상기 대상 팩스 문서의 출력 여부를 결정하는 출력 단계를 포함하고,판별이 완료된 문서를 판별 결과에 따라 상기 분석용 팩스 스팸 문서 집단과 상기 분석용 팩스 일반 문서 집단 중 어느 하나에 포함시켜 스팸 분류 알고리즘을 자동 업데이트시키는 단계를 더 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
2 |
2
제 1 항에 있어서, 상기 분석용 팩스 스팸 문서는 팩스 문서의 내용을 기반으로 스팸 문서로 판별된 문서이고, 분석용 팩스 일반 문서는 팩스 문서의 내용을 기반으로 하여 수신에 적합한 것으로 판별된 문서인 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
3 |
3
제 2 항에 있어서, 상기 분류 알고리즘 생성 단계는상기 팩스 스팸 문서 집단 및 상기 팩스 일반 문서 집단을 개별적으로 스캔하는 단계;상기 스캐닝된 팩스 스팸 문서 집단 및 상기 스캐닝된 팩스 일반 문서 집단에 포함된 단어의 출현 빈도를 개별적으로 산출하는 단계;상기 출현 빈도를 기반으로 팩스 스팸 문서 모델링 및 팩스 일반 문서 모델링을 개별적으로 수행하는 단계; 및상기 모델링된 팩스 스팸 문서 및 상기 모델링된 팩스 일반 문서 중 적어도 어느 하나를 기반으로 상기 분류 알고리즘을 생성하는 단계를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
4 |
4
제 3 항에 있어서, 상기 출현 빈도 산출 단계는상기 스캔된 문서를 전처리하여 불용어를 제거하고 단어만 추출하는 단계; 및상기 추출된 단어를 기반으로 출현 빈도를 산출하는 단계를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
5 |
5
제 3 항에 있어서, 상기 모델링 수행 단계는상기 출현 빈도를 기반으로 하여 특징을 선택하는 단계;상기 선택된 특징을 지지 벡터 머신(SVM: Support Vector Machine)의 특징 벡터로 사용하여 팩스 스팸 문서 모델링 및 팩스 일반 문서 모델링을 수행하는 단계를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
6 |
6
제 5 항에 있어서, 상기 특징을 선택하는 단계는상기 출현 빈도가 높은 상위 N 개 - 여기서, N은 임의의 자연수 - 의 단어를 추출하는 단계를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
7 |
7
제 1 항에 있어서, 상기 스팸 분류 알고리즘이 나이브 베이지안 분류 방법(Naive Bayesian Classifier)을 이용하여 생성되는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
8 |
8
제 1 항에 있어서, 상기 출력 여부 결정 단계는상기 대상 팩스 문서가 스팸 문서로 판별된 경우에는 출력하지 않고, 지정된 온라인 지점으로 자동으로 전송하는 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
9 |
9
제 8 항에 있어서, 상기 온라인 지점은 사용자 이메일 주소 또는 사용자 지정 웹하드인 것을 특징으로 하는 팩스 스팸 문서 차단 방법
|
10 |
10
제 1 항에 있어서, 판별이 완료된 대상 팩스 문서는 판별 결과에 따라 상기 분석용 팩스 스팸 문서 집단과 상기 분석용 팩스 일반 문서 집단 중 어느 하나에 포함되는 것을 특징을 하는 팩스 스팸 문서 차단 방법
|
11 |
11
분석용 팩스 스팸 문서 집단과 분석용 팩스 일반 문서 집단 중 적어도 어느 하나를 토대로 스팸 분류 알고리즘을 생성하는 분류 알고리즘 생성부;상기 스팸 분류 알고리즘을 이용하여 수신된 대상 팩스 문서가 스팸 문서인지 판별하는 판별부; 및판별 결과를 기반으로 상기 대상 팩스 문서의 출력 여부를 결정하는 출력 결정부를 포함하되,판별이 완료된 문서를 판별 결과에 따라 상기 분석용 팩스 스팸 문서 집단과 상기 분석용 팩스 일반 문서 집단 중 어느 하나에 포함시켜 스팸 분류 알고리즘을 자동 업데이트시키는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
12 |
12
제 11 항에 있어서, 상기 분석용 팩스 스팸 문서는 팩스 문서의 내용을 기반으로 스팸 문서로 판별된 문서이고, 분석용 팩스 일반 문서는 팩스 문서의 내용을 기반으로 하여 수신에 적합한 것으로 판별된 문서인 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
13 |
13
제 11 항에 있어서, 상기 분류 알고리즘 생성부는상기 팩스 스팸 문서 집단 및 상기 팩스 일반 문서 집단을 개별적으로 스캔하는 스캔 수행부;상기 스캔된 팩스 스팸 문서 집단 및 상기 팩스 일반 문서 집단에 포함된 단어의 출현 빈도를 개별적으로 산출하는 출현 빈도 산출부;상기 출현 빈도를 기반으로 팩스 스팸 문서 모델링 및 팩스 일반 문서 모델링을 개별적으로 수행하는 모델링부; 및상기 모델링된 팩스 스팸 문서 및 상기 모델링된 팩스 일반 문서 중 적어도 어느 하나를 기반으로 상기 분류 알고리즘을 생성하는 알고리즘 생성부를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
14 |
14
제 13 항에 있어서, 상기 출현 빈도 산출부는상기 스캔된 문서를 전처리하여 불용어를 제거하고 단어만 추출하는 단어 추출부; 및상기 추출된 단어를 기반으로 출현 빈도를 산출하는 산출부를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
15 |
15
제 13 항에 있어서, 상기 모델링부는상기 출현 빈도가 높은 상위 N 개 - 여기서, N은 임의의 자연수 - 의 단어를 추출하는 상위 단어 추출부; 및상기 추출된 단어를 지지 벡터 머신(SVM: Support Vector Machine)의 특징 벡터로 사용하여 팩스 스팸 문서 모델링 및 팩스 일반 문서 모델링을 수행하는 펙스 문서 모델링부를 포함하는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
16 |
16
제 11 항에 있어서, 상기 스팸 분류 알고리즘이 나이브 베이지안 분류 방법(Naive Bayesian Classifier)을 이용하여 생성되는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
17 |
17
제 11 항에 있어서, 상기 출력 결정부는상기 대상 팩스 문서가 스팸 문서로 판별된 경우에는 출력하지 않고, 지정된 온라인 지점으로 자동으로 전송하는 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
18 |
18
제 17 항에 있어서, 상기 온라인 지점은 사용자 이메일 주소 또는 사용자 지정 웹하드인 것을 특징으로 하는 팩스 스팸 문서 차단 장치
|
19 |
19
제 11 항에 있어서, 판별이 완료된 대상 팩스 문서는 판별 결과에 따라 상기 분석용 팩스 스팸 문서 집단과 상기 분석용 팩스 일반 문서 집단 중 어느 하나에 포함되는 것을 특징을 하는 팩스 스팸 문서 차단 장치
|
20 |
20
대상 팩스 문서를 전송하는 수신 팩스 장치로 전송 팩스 장치; 및 분석용 팩스 스팸 문서 집단과 분석용 팩스 일반 문서 집단 중 적어도 어느 하나를 토대로 스팸 분류 알고리즘을 생성하고, 상기 스팸 분류 알고리즘을 이용하여 상기 전송 팩스 장치로부터 수신된 대상 팩스 문서가 스팸 문서인지 판별하며, 판별 결과를 기반으로 상기 대상 팩스 문서의 출력 여부를 결정하는 수신 팩스 장치를 포함하되, 상기 수신 팩스 장치는판별이 완료된 문서를 판별 결과에 따라 상기 분석용 팩스 스팸 문서 집단과 상기 분석용 팩스 일반 문서 집단 중 어느 하나에 포함시켜 스팸 분류 알고리즘을 자동 업데이트시키는 것을 특징으로 하는 팩스 스팸 문서 차단 시스템
|