맞춤기술찾기

이전대상기술

스팸 문서 판단 방법 및 그 판단 장치

  • 기술번호 : KST2015191206
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 스팸 문서를 판단하는 기술에 관한 것으로, 본 발명의 일 실시예에 따른 스팸 문서 판단 방법은, 문서로부터 특수 문자, 색인어, 링크 정보를 추출하는 단계와, 상기 문서에서 상기 특수 문자의 출현 비율, 상기 특수 문자가 스팸 문서에서 출현할 확률을 이용한 특수 문자 스팸지수, 상기 색인어의 스팸 문서에서 출현할 확률을 이용한 색인어 스팸지수, 상기 색인어의 출현 빈도에 대한 표준편차, 상기 색인어의 출현 빈도의 평균에서 상기 표준편차를 초과하여 반복 출현하는 비정상 색인어의 출현 비율, 상기 반복 출현하는 색인어들의 개수 비율, 웹 페이지 주소로 유도하는 상기 링크의 개수 중 적어도 하나를 포함하는 특징 변수를 설정하는 단계와, 상기 특징 변수들의 값을 기계학습 알고리즘을 이용하여 계산하는 특징 변수를 계산하는 단계와, 상기 계산된 특징 변수들의 값을 미리 설정된 스팸 문서 분류 모델로 분석하여, 상기 문서의 스팸 문서 여부를 판단하는 단계를 포함한다. 이에 따라, 자질어만을 이용하는 기존의 스팸 문서 판단 방법에 비해 스팸 문서 분류의 정확도를 향상시킬 수 있다.
Int. CL G06F 21/30 (2013.01) G06F 17/10 (2006.01)
CPC G06F 17/18(2013.01) G06F 17/18(2013.01) G06F 17/18(2013.01)
출원번호/일자 1020110084554 (2011.08.24)
출원인 숭실대학교산학협력단
등록번호/일자 10-1291076-0000 (2013.07.24)
공개번호/일자 10-2013-0021956 (2013.03.06) 문서열기
공고번호/일자 (20130823) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2011.08.24)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수원 대한민국 서울특별시 서초구
2 이성진 대한민국 서울특별시 관악구
3 한정석 대한민국 서울특별시 관악구
4 백종범 대한민국 경기도 용인시 기흥구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인태백 대한민국 서울 금천구 가산디지털*로 *** 이노플렉스 *차 ***호

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 서울특별시 동작구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2011.08.24 수리 (Accepted) 1-1-2011-0658081-59
2 선행기술조사의뢰서
Request for Prior Art Search
2012.09.14 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2012.10.15 수리 (Accepted) 9-1-2012-0078003-58
4 의견제출통지서
Notification of reason for refusal
2013.02.15 발송처리완료 (Completion of Transmission) 9-5-2013-0104857-05
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2013.03.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2013-0195830-37
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2013.03.06 수리 (Accepted) 1-1-2013-0195831-83
7 등록결정서
Decision to grant
2013.07.17 발송처리완료 (Completion of Transmission) 9-5-2013-0490916-09
8 [일부 청구항 포기]취하(포기)서
[Abandonment of Partial Claims] Request for Withdrawal (Abandonment)
2013.07.24 수리 (Accepted) 2-1-2013-0390437-50
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문서로부터 특수 문자, 색인어, 링크 정보를 추출하는 단계;상기 문서에서 상기 특수 문자의 출현 비율, 상기 특수 문자가 스팸 문서에서 출현할 확률을 이용한 특수 문자 스팸지수, 상기 색인어의 스팸 문서에서 출현할 확률을 이용한 색인어 스팸지수, 상기 색인어의 출현 빈도에 대한 표준편차, 상기 색인어의 출현 빈도의 평균에서 상기 표준편차를 초과하여 반복 출현하는 비정상 색인어의 출현 비율, 상기 반복 출현하는 색인어들의 개수 비율, 웹 페이지 주소로 유도하는 상기 링크의 개수 중 적어도 하나를 포함하는 특징 변수를 설정하는 단계;상기 특징 변수들의 값을 기계학습 알고리즘을 이용하여 계산하는 특징 변수를 계산하는 단계; 및상기 계산된 특징 변수들의 값을 미리 설정된 스팸 문서 분류 모델로 분석하여, 상기 문서의 스팸 문서 여부를 판단하는 단계를 포함하고,상기 특징 변수를 계산하는 단계는,상기 특수 문자가 스팸 문서에서 출현할 확률에 대한 가중치를 부여하여 계산한 특수 문자 스팸지수(SCSVi)를 다음의 수학식을 이용하여 계산하는 스팸 문서 판단 방법:여기서, TFi(SCj)는 문서 i에서 특수 문자 j의 출현 빈도를, PrS(SCj)는 스팸 문서에서 특수 문자 j의 출현 확률을, Pr(SCj)는 전체 문서에서 특수 문자 j의 출현 확률을, TFSumi(C)는 문서 i에서 출현한 문자의 출현 빈도의 합을 나타낸다
2 2
삭제
3 3
청구항 3은(는) 설정등록료 납부시 포기되었습니다
4 4
청구항 4은(는) 설정등록료 납부시 포기되었습니다
5 5
제1항에 있어서, 상기 기계학습 알고리즘은 의사결정트리, 나이브 베이지안, 신경망, SVM 중 어느 하나를 이용하는 스팸 문서 판단 방법
6 6
문서로부터 특수 문자, 색인어, 링크 정보를 추출하는 정보 추출부;상기 문서에서 상기 특수 문자의 출현 비율, 상기 특수 문자가 스팸 문서에서 출현할 확률을 이용한 특수 문자 스팸지수, 상기 색인어의 스팸 문서에서 출현할 확률을 이용한 색인어 스팸지수, 상기 색인어의 출현 빈도에 대한 표준편차, 상기 색인어의 출현 빈도의 평균에서 상기 표준편차를 초과하여 반복 출현하는 비정상 색인어의 출현 비율, 상기 반복 출현하는 색인어들의 개수 비율, 웹 페이지 주소로 유도하는 상기 링크의 개수 중 적어도 하나를 포함하는 특징 변수를 설정하는 특징 변수 설정부;상기 특징 변수들의 값을 기계학습 알고리즘을 이용하여 계산하는 특징 변수 계산부; 및상기 계산된 특징 변수들의 값을 상기 특징 변수를 이용해 미리 설정된 스팸 문서 분류 모델로 분석하여, 상기 문서의 스팸 문서 여부를 판단하는 스팸 문서 판단부를 포함하고,상기 특징 변수 계산부는,상기 특수 문자가 스팸 문서에서 출현할 확률에 대한 가중치를 부여하여 계산한 특수 문자 스팸지수(SCSVi)를 다음의 수학식을 이용하여 계산하는 스팸 문서 판단 장치:여기서, TFi(SCj)는 문서 i에서 특수 문자 j의 출현 빈도를, PrS(SCj)는 스팸 문서에서 특수 문자 j의 출현 확률을, Pr(SCj)는 전체 문서에서 특수 문자 j의 출현 확률을, TFSumi(C)는 문서 i에서 출현한 문자의 출현 빈도의 합을 나타낸다
7 7
삭제
8 8
청구항 8은(는) 설정등록료 납부시 포기되었습니다
9 9
청구항 9은(는) 설정등록료 납부시 포기되었습니다
10 10
제6항에 있어서, 상기 기계학습 알고리즘은 의사결정트리, 나이브 베이지안, 신경망, SVM 중 어느 하나를 이용하는 스팸 문서 판단 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.