맞춤기술찾기

이전대상기술

웹 로봇 탐지 시스템 및 방법

  • 기술번호 : KST2015155053
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 웹 로봇 탐지 시스템 및 방법에 관한 것으로서, 인터넷에 분산된 적어도 하나 이상의 감시 대상 웹 서버; 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그(Web log)를 수집하여, 원시 포맷 형태의 표준 웹 로그를 전달하는 웹 로그 서버; 웹 로그 서버로부터 하나의 HTTP 요청마다 생성되는 표준 웹 로그를 수집하여 로그 큐에 저장하고, HTTP 세션의 타임아웃을 고려하여 가장 먼저 발생된 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 기 정의된 차별화 특성 정보를 추출하여 현재 세션과 전체 사용자 사이의 특성 비율을 계산하여 웹 로봇인지 정상 사용자 인지를 탐지하는 웹 로봇 탐지 서버; 및 웹 로봇 탐지 서버로부터 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 수신받아 대응하는 모니터링 시스템을 포함한다. 그러므로, 웹 로봇 탐지 시스템은, 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 웹 로봇을 탐지한다. 이때, 전체 사용자의 복합 특성 벡터값은 웹 서버에서 발생하는 모든 HTTP 요청에 의해 갱신되며 감시 대상 세션의 벡터값은 해당 세션에서 발생하는 HTTP 요청에 의해 갱신된다.
Int. CL G06F 15/16 (2006.01) G06F 11/30 (2006.01)
CPC H04L 67/22(2013.01) H04L 67/22(2013.01) H04L 67/22(2013.01)
출원번호/일자 1020100031165 (2010.04.06)
출원인 국방과학연구소
등록번호/일자 10-1148002-0000 (2012.05.15)
공개번호/일자 10-2011-0111863 (2011.10.12) 문서열기
공고번호/일자 (20120524) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2010.04.06)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 장희진 대한민국 서울특별시 송파구
2 이동건 대한민국 서울특별시 송파구
3 차성덕 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인원전 대한민국 서울특별시 강남구 테헤란로 ***, 풍림빌딩 *층 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2010.04.06 수리 (Accepted) 1-1-2010-0217182-51
2 선행기술조사의뢰서
Request for Prior Art Search
2011.05.12 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2011.06.23 수리 (Accepted) 9-1-2011-0054618-20
4 의견제출통지서
Notification of reason for refusal
2011.09.26 발송처리완료 (Completion of Transmission) 9-5-2011-0545652-49
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.11.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0936729-80
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.11.25 수리 (Accepted) 1-1-2011-0936730-26
7 최후의견제출통지서
Notification of reason for final refusal
2011.12.29 발송처리완료 (Completion of Transmission) 9-5-2011-0778322-96
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2012.01.19 수리 (Accepted) 1-1-2012-0050406-46
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2012.01.19 보정승인 (Acceptance of amendment) 1-1-2012-0050407-92
10 등록결정서
Decision to grant
2012.04.30 발송처리완료 (Completion of Transmission) 9-5-2012-0254856-43
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.07.22 수리 (Accepted) 4-1-2013-0033275-90
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
인터넷에 연결된 적어도 하나 이상의 감시 대상 웹 서버; 상기 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그(Web log)를 수집하여, 원시 포맷(Raw Format) 형태의 표준 웹 로그를 전달하는 웹 로그 서버; 상기 웹 로그 서버로부터 하나의 HTTP 요청마다 생성되는 원시 포맷 형태의 표준 웹 로그를 수집하여, 상기 표준 웹 로그로부터 추출된 차별화 특성 정보를 고려하여 극좌표계의 복합 특성 벡터(CAV:Composite Attribute Vector)의 각도와 길이로 표시하여 웹 로봇인지 정상 사용자 인지를 나타내는 탐지된 결과를 제공하는 웹 로봇 탐지 서버; 및 상기 웹 로봇 탐지 서버로부터 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 수신받아 대응하는 모니터링 시스템을 포함하여 이루어지는 웹 로봇 탐지 시스템에 있어서,상기 웹 로봇 탐지 서버가,상기 웹 로그 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, HTTP 세션의 타임아웃을 고려하여 반복적으로 가장 먼저 발생된 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 데이터 가공 및 전처리부; 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 세션의 특성 정보 및 전체 사용자의 평균 특성 정보를 추출하고, 현재 감시 대상 세션(HTTP 세션)과 전체 사용자 사이의 특성 비율을 계산하여, 복합 특성 벡터(CAV)의 각도와 길이로 나타내고 탐지 결과를 결정하여, 상기 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 제공하는 탐지부; 및 상기 탐지부로부터 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 감시 대상 웹 서버의 정해진 정책에 따라 모니터링 시스템으로 관리자에게 보고하는 경고 및 보고부를 포함하는 것을 특징으로 하는 웹 로봇 탐지 시스템
2 2
삭제
3 3
제1항에 있어서,상기 탐지부는, 전체 사용자 평균 특성 정보를 관리하는 전체 사용자 관리부;개별 감시 대상 세션의 특성 정보를 관리하는 개별 세션 관리부; 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하고, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션(HTTP 세션)과 전체 사용자의 평균과의 상대적 차이(γ)를 이용한 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균을 고려하여 길이 성분에 가중치를 곱하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하고, 하나의 HTTP 요청에 대한 CAV값과 이를 포함한 기존 감시 대상 세션 전체의 CAV값의 벡터합을 통해 현재 감시 대상 세션의 CAV값 갱신하는 감시 대상 세션의 복합 특성 벡터 연산부; 및 상기 감시 대상 세션의 복합 특성 벡터 연산부로부터 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로, 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이 성분으로 결과의 신뢰도를 확인하며, 상기 웹 로봇인지 정상 사용자인지를 판별하여 상기 탐지된 결과를 제공하는 비교 분석부;를 포함하는 것을 특징으로 하는 웹 로봇 탐지 시스템
4 4
제1항에 있어서,상기 차별화 특성 정보는, Client-Server Bytes, Head 요청 비율, Referer 페이지 존재 비율, HTTP Error 비율, 이미지 자원과 동적/정적 웹 페이지 비율, Inter-Request Gap의 시간 평균,‘robots
5 5
제3항에 있어서,상기 탐지부는, 개별 감시 대상 세션과 전체 사용자의 차별화 특성 정보의 평균 데이터를 상기 데이터 가공 및 전처리부로부터 전달된 상기 차별화 특성 정보를 가지고 EMA(Exponential Moving Average), 카운트, 평균을 이용하여 갱신하고, 갱신된 전체 사용자의 평균과 상기 현재 감시 대상 세션의 평균의 상대적 차이(γ)를 계산하고, 그 결과를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 산출하는 것을 특징으로 하는 웹 로봇 탐지 시스템
6 6
적어도 하나 이상의 감시 대상 웹 서버와 연동된 웹 로그 서버, 웹 로봇 탐지 서버, 및 모니터링 시스템을 구비하는 웹 로봇 탐지 방법에 있어서, (a) 상기 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 웹 로그 서버에서 수집하는 단계; 및(b) 상기 웹 로그 서버로부터 상기 웹 로봇 탐지 서버의 데이터 가공 및 전처리부로 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, 반복적으로 가장 먼저 발생한 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 단계; (c) 감시 대상 세션의 복합 특성 벡터 연산부에서 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하며, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션의 평균과 전체 사용자의 평균과의 상대적 차이(γ)를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균과 길이 가중치를 부과하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하며, 하나의 현재 HTTP 요청에 대한 CAV값과 이를 포함한 기존 이전 요청까지의 감시 대상 세션 전체의 CAV값의 벡터합을 통한 현재 감시 대상 세션의 CAV값을 갱신하는 단계; (d) 비교 분석부에서 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이성분으로 결과에 대한 신뢰도를 확인하며, 웹 로봇인지 정상 사용자인지를 판별하여 탐지된 결과를 경고 및 보고부로 제공하는 단계; 및 (e) 경고 및 보고부가 상기 비교분석부로부터 상기 웹 로봇인지 정상 사용자인지에 대한 탐지된 결과를 수신받아 모니터링 시스템으로 제공하는 단계;를 포함하는 것을 특징으로 하는 웹 로봇 탐지 방법
7 7
삭제
8 8
제6항에 있어서,상기 차별화 특성 정보는, Client-Server Bytes, Head 요청 비율, Referer 페이지 존재 비율, HTTP Error 비율, 이미지 자원과 동적/정적 웹 페이지 비율, Inter-Request Gap의 시간 평균,‘robots
9 9
제6항 또는 제8항에 있어서,상기 단계 (c)는, 개별 감시 대상 세션과 전체 사용자의 차별화 특성 정보의 평균 데이터를 데이터 가공 및 전처리부로부터 전달된 차별화 특성 정보를 가지고 EMA(Exponential Moving Average), 카운트, 평균을 이용하여 갱신하고, 갱신된 전체 사용자의 평균과 감시 대상 세션의 평균의 상대적 차이(γ)를 계산하고, 그 결과를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하는 것을 특징으로 하는 웹 로봇 탐지 방법
10 10
컴퓨터에, (a) 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 웹 로그 서버에서 수집하는 기능; 및(b) 상기 웹 로그 서버로부터 웹 로봇 탐지 서버의 데이터 가공 및 전처리부로 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, 반복적으로 가장 먼저 발생한 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 기능; (c) 감시 대상 세션의 복합 특성 벡터 연산부에서 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하며, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션의 평균과 갱신된 전체 사용자의 평균과의 상대적 차이(γ)를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균과 길이 가중치를 부과하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하며, 하나의 현재 HTTP 요청에 대한 CAV값과 이를 포함한 기존 이전 요청까지의 감시 대상 세션 전체의 CAV값의 벡터합을 통한 현재 감시 대상 세션의 CAV값을 갱신하는 기능; (d) 비교 분석부에서 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이성분으로 결과에 대한 신뢰도를 확인하며, 웹 로봇인지 정상 사용자인지를 판별하여 탐지된 결과를 경고 및 보고부로 제공하는 기능; 및 (e) 경고 및 보고부가 상기 비교분석부로부터 상기 웹 로봇인지 정상 사용자인지에 대한 탐지된 결과를 수신받아 모니터링 시스템으로 제공하는 기능;을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.