맞춤기술찾기

이전대상기술

스팸 분류 방법, 이를 수행하기 위한 기록 매체 및 스팸 분류 장치(METHOD FOR SPAM CLASSFICATION, RECORDING MEDIUM AND DEVICE FOR PERFORMING THE METHOD)

  • 기술번호 : KST2016011619
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 스팸 분류 방법은, 정상 문서와 스팸 문서로부터, 문서의 구조적 특징을 포함하는 단일 문서의 특징을 추출하는 단계; 추출된 상기 단일 문서의 특징을 학습 데이터로 사용하여 문서 분류 모델을 생성하는 단계; 분류 대상 문서로부터 단일 문서의 특징을 추출하는 단계; 및 상기 분류 대상 문서의 특징을 상기 분류 모델에 적용하여 상기 분류 대상 문서가 스팸 문서인지 판별하는 단계를 포함한다. 이에 따라, 효율적이고 경제적인 스팸 차단을 수행할 수 있다.
Int. CL G06F 17/21 (2006.01) G06F 21/60 (2013.01)
CPC G06F 21/60(2013.01) G06F 21/60(2013.01) G06F 21/60(2013.01)
출원번호/일자 1020140172921 (2014.12.04)
출원인 숭실대학교산학협력단
등록번호/일자 10-1692244-0000 (2016.12.28)
공개번호/일자 10-2016-0067473 (2016.06.14) 문서열기
공고번호/일자 (20170103) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.12.04)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수원 대한민국 서울특별시 동작구
2 심상권 대한민국 서울특별시 동작구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤귀상 대한민국 서울특별시 금천구 디지털로*길 ** ***호 (가산동, 한신IT타워*차)(디앤특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 서울특별시 동작구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.12.04 수리 (Accepted) 1-1-2014-1181452-78
2 선행기술조사의뢰서
Request for Prior Art Search
2015.04.10 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2015.06.10 수리 (Accepted) 9-1-2015-0039105-62
4 의견제출통지서
Notification of reason for refusal
2015.10.22 발송처리완료 (Completion of Transmission) 9-5-2015-0731475-76
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.12.22 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-1256408-40
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.12.22 수리 (Accepted) 1-1-2015-1256401-21
7 최후의견제출통지서
Notification of reason for final refusal
2016.04.12 발송처리완료 (Completion of Transmission) 9-5-2016-0265263-85
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.05.30 보정승인 (Acceptance of amendment) 1-1-2016-0516446-18
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.05.30 수리 (Accepted) 1-1-2016-0516441-80
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
11 최후의견제출통지서
Notification of reason for final refusal
2016.10.13 발송처리완료 (Completion of Transmission) 9-5-2016-0734984-53
12 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.10.14 수리 (Accepted) 1-1-2016-0996992-49
13 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.10.14 보정승인 (Acceptance of amendment) 1-1-2016-0996993-95
14 등록결정서
Decision to grant
2016.12.26 발송처리완료 (Completion of Transmission) 9-5-2016-0931359-58
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
정상 문서와 스팸 문서로부터, 문서의 구조적 특징을 포함하는 단일 문서의 특징을 추출하는 단계;추출된 상기 단일 문서의 특징을 학습 데이터로 사용하여 문서 분류 모델을 생성하는 단계;분류 대상 문서로부터 단일 문서의 특징을 추출하는 단계; 및상기 분류 대상 문서의 특징을 상기 분류 모델에 적용하여 상기 분류 대상 문서가 스팸 문서인지 판별하는 단계를 포함하며,상기 단일 문서의 특징은 문서의 길이, 문서의 길이 비율, HTML 태그의 개수, 공백 문자의 비율, 새줄 문자의 개수, 본문에 등장하는 단어의 개수, 앵커 태그의 개수 및 제목과 본문 첫 번째 문장의 유사도를 모두 포함하며,상기 단일 문서의 특징이 문서의 길이 비율이면 태그를 제외한 문서의 길이와 태그를 포함한 문서의 길이의 비율을 계산하여 단일 문서가 스팸 문서인지 판별하고, 상기 단일 문서의 특징이 공백 문자의 비율이면 태그를 제외한 문서의 길이와 공백 문자의 개수의 비율을 계산하여 단일 문서가 스팸 문서인지 판별하는, 스팸 분류 방법
2 2
제1항에 있어서,상기 단일 문서의 특징이 새줄 문자의 개수이면 다음 수식 1에 의해 새줄 문자의 개수를 추출하고, 추출된 새줄 문자의 개수가 미리 학습된 스팸 문서의 새줄 문자의 개수보다 많으면 분류 대상 문서를 일반 문서로 인식하며,수식 1(여기서, :문서, :새줄 문자)상기 단일 문서의 특징이 앵커 태그의 개수이면 다음 수식 2에 의해 앵커 태그의 개수를 추출하고, 추출된 앵커 태그의 개수가 미리 학습된 스팸 문서의 앵커 태그의 개수보다 적으면 분류 대상 문서를 일반 문서로 인식하는 것을 더 포함하는, 스팸 분류 방법
3 3
삭제
4 4
제1항에 있어서, 상기 단일 문서의 특징은,각 특징마다 정해진 수식을 통해 특징값으로 계산되는, 스팸 분류 방법
5 5
제4항에 있어서, 상기 문서 분류 모델을 생성하는 단계는,정상 문서의 각 특징값과 태깅값 및 스팸 문서의 각 특징값과 태깅값을 저장하는 단계를 포함하는, 스팸 분류 방법
6 6
제1, 2, 4, 5항 중 어느 하나의 항에 따른 스팸 분류 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체
7 7
문서의 구조적 특징을 포함하는 단일 문서의 특징을 추출하는 특징 추출부;정상 문서와 스팸 문서로부터 추출된 상기 단일 문서의 특징을 학습 데이터로 사용하여, 정상 문서와 스팸 문서를 판별하기 위한 문서 분류 모델을 생성하는 모델 생성부; 및분류 대상 문서의 특징을 상기 분류 모델에 적용하여 상기 분류 대상 문서가 스팸 문서인지 판별하는 스팸 판별부를 포함하며,상기 특징 추출부는 HTML 태그를 제외한 문서와 HTML 태그를 포함한 문서의 특징을 별도로 추출하고, 상기 스팸 판별부는 HTML 태그를 제외한 문서와 HTML 태그를 포함한 문서의 특징을 이용하여 상기 분류 대상 문서가 스팸 문서인지 판별하는 것인, 스팸 분류 장치
8 8
제7항에 있어서, 상기 스팸 판별부는,상기 단일 문서의 특징이 문서의 길이 비율이면 HTML 태그를 제외한 문서의 길이와 HTML 태그를 포함한 문서의 길이의 비율을 계산하여 단일 문서가 스팸 문서인지 판별하는 것인, 스팸 분류 장치
9 9
제7항에 있어서, 상기 스팸 판별부는,상기 단일 문서의 특징이 공백 문자의 비율이면 HTML 태그를 제외한 문서의 길이와 공백 문자의 개수의 비율을 계산하여 단일 문서가 스팸 문서인지 판별하는 것인, 스팸 분류 장치
10 10
제 7 항에 있어서, 상기 특징 추출부는 다음 수식에 의해 새줄 문자의 개수를 추출하고, 상기 스팸 판별부는 추출된 새줄 문자의 개수가 미리 학습된 스팸 문서의 새줄 문자의 개수보다 많으면 분류 대상 문서를 일반 문서로 인식하는 것을 더 포함하는 스팸 분류 장치
11 11
제 7 항에 있어서,상기 특징 추출부는 다음 수식에 의해 앵커 태그의 수를 판별하고, 상기 스팸 판별부는 앵커 태그의 수가 미리 학습된 스팸 문서의 앵커 태그의 수보다 적으면 일반 문서로 인식하는 것을 더 포함하는 스팸 분류 장치
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2016088954 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2016088954 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 숭실대학교 산학협력단 융합미디어원천기술개발사업 사회문제에 관한 도메인 별 이벤트 추출 및 예측 기술 개발
2 미래창조과학부 숭실대학교 산학협력단 중견연구자지원사업 Open Innovation을 통한 소비자 행동 이론 기반 데이터마이닝 융합 기술 개발
3 산업통상자원부 (주)인우기술 산학융합 연구마을 지원사업 소셜 스트림 기반 속성별제품평판 자동분석 및 검색 솔루션