1 |
1
인터넷에 연결된 적어도 하나 이상의 감시 대상 웹 서버; 상기 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그(Web log)를 수집하여, 원시 포맷(Raw Format) 형태의 표준 웹 로그를 전달하는 웹 로그 서버; 상기 웹 로그 서버로부터 하나의 HTTP 요청마다 생성되는 원시 포맷 형태의 표준 웹 로그를 수집하여, 상기 표준 웹 로그로부터 추출된 차별화 특성 정보를 고려하여 극좌표계의 복합 특성 벡터(CAV:Composite Attribute Vector)의 각도와 길이로 표시하여 웹 로봇인지 정상 사용자 인지를 나타내는 탐지된 결과를 제공하는 웹 로봇 탐지 서버; 및 상기 웹 로봇 탐지 서버로부터 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 수신받아 대응하는 모니터링 시스템을 포함하여 이루어지는 웹 로봇 탐지 시스템에 있어서,상기 웹 로봇 탐지 서버가,상기 웹 로그 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, HTTP 세션의 타임아웃을 고려하여 반복적으로 가장 먼저 발생된 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 데이터 가공 및 전처리부; 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 세션의 특성 정보 및 전체 사용자의 평균 특성 정보를 추출하고, 현재 감시 대상 세션(HTTP 세션)과 전체 사용자 사이의 특성 비율을 계산하여, 복합 특성 벡터(CAV)의 각도와 길이로 나타내고 탐지 결과를 결정하여, 상기 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 제공하는 탐지부; 및 상기 탐지부로부터 웹 로봇인지 정상 사용자인지를 나타내는 탐지된 결과를 감시 대상 웹 서버의 정해진 정책에 따라 모니터링 시스템으로 관리자에게 보고하는 경고 및 보고부를 포함하는 것을 특징으로 하는 웹 로봇 탐지 시스템
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 탐지부는, 전체 사용자 평균 특성 정보를 관리하는 전체 사용자 관리부;개별 감시 대상 세션의 특성 정보를 관리하는 개별 세션 관리부; 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하고, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션(HTTP 세션)과 전체 사용자의 평균과의 상대적 차이(γ)를 이용한 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균을 고려하여 길이 성분에 가중치를 곱하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하고, 하나의 HTTP 요청에 대한 CAV값과 이를 포함한 기존 감시 대상 세션 전체의 CAV값의 벡터합을 통해 현재 감시 대상 세션의 CAV값 갱신하는 감시 대상 세션의 복합 특성 벡터 연산부; 및 상기 감시 대상 세션의 복합 특성 벡터 연산부로부터 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로, 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이 성분으로 결과의 신뢰도를 확인하며, 상기 웹 로봇인지 정상 사용자인지를 판별하여 상기 탐지된 결과를 제공하는 비교 분석부;를 포함하는 것을 특징으로 하는 웹 로봇 탐지 시스템
|
4 |
4
제1항에 있어서,상기 차별화 특성 정보는, Client-Server Bytes, Head 요청 비율, Referer 페이지 존재 비율, HTTP Error 비율, 이미지 자원과 동적/정적 웹 페이지 비율, Inter-Request Gap의 시간 평균,‘robots
|
5 |
5
제3항에 있어서,상기 탐지부는, 개별 감시 대상 세션과 전체 사용자의 차별화 특성 정보의 평균 데이터를 상기 데이터 가공 및 전처리부로부터 전달된 상기 차별화 특성 정보를 가지고 EMA(Exponential Moving Average), 카운트, 평균을 이용하여 갱신하고, 갱신된 전체 사용자의 평균과 상기 현재 감시 대상 세션의 평균의 상대적 차이(γ)를 계산하고, 그 결과를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 산출하는 것을 특징으로 하는 웹 로봇 탐지 시스템
|
6 |
6
적어도 하나 이상의 감시 대상 웹 서버와 연동된 웹 로그 서버, 웹 로봇 탐지 서버, 및 모니터링 시스템을 구비하는 웹 로봇 탐지 방법에 있어서, (a) 상기 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 웹 로그 서버에서 수집하는 단계; 및(b) 상기 웹 로그 서버로부터 상기 웹 로봇 탐지 서버의 데이터 가공 및 전처리부로 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, 반복적으로 가장 먼저 발생한 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 단계; (c) 감시 대상 세션의 복합 특성 벡터 연산부에서 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하며, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션의 평균과 전체 사용자의 평균과의 상대적 차이(γ)를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균과 길이 가중치를 부과하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하며, 하나의 현재 HTTP 요청에 대한 CAV값과 이를 포함한 기존 이전 요청까지의 감시 대상 세션 전체의 CAV값의 벡터합을 통한 현재 감시 대상 세션의 CAV값을 갱신하는 단계; (d) 비교 분석부에서 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이성분으로 결과에 대한 신뢰도를 확인하며, 웹 로봇인지 정상 사용자인지를 판별하여 탐지된 결과를 경고 및 보고부로 제공하는 단계; 및 (e) 경고 및 보고부가 상기 비교분석부로부터 상기 웹 로봇인지 정상 사용자인지에 대한 탐지된 결과를 수신받아 모니터링 시스템으로 제공하는 단계;를 포함하는 것을 특징으로 하는 웹 로봇 탐지 방법
|
7 |
7
삭제
|
8 |
8
제6항에 있어서,상기 차별화 특성 정보는, Client-Server Bytes, Head 요청 비율, Referer 페이지 존재 비율, HTTP Error 비율, 이미지 자원과 동적/정적 웹 페이지 비율, Inter-Request Gap의 시간 평균,‘robots
|
9 |
9
제6항 또는 제8항에 있어서,상기 단계 (c)는, 개별 감시 대상 세션과 전체 사용자의 차별화 특성 정보의 평균 데이터를 데이터 가공 및 전처리부로부터 전달된 차별화 특성 정보를 가지고 EMA(Exponential Moving Average), 카운트, 평균을 이용하여 갱신하고, 갱신된 전체 사용자의 평균과 감시 대상 세션의 평균의 상대적 차이(γ)를 계산하고, 그 결과를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하는 것을 특징으로 하는 웹 로봇 탐지 방법
|
10 |
10
컴퓨터에, (a) 적어도 하나 이상의 감시 대상 웹 서버로부터 하나의 HTTP 요청마다 생성되는 웹 로그를 웹 로그 서버에서 수집하는 기능; 및(b) 상기 웹 로그 서버로부터 웹 로봇 탐지 서버의 데이터 가공 및 전처리부로 하나의 HTTP 요청마다 생성되는 웹 로그를 수집하여 로그 큐(log queue)에 저장하고, 반복적으로 가장 먼저 발생한 HTTP 요청부터 웹로그를 파싱하고, 파싱된 정보로부터 차별화 특성 정보로 가공한 후, 미리 정해진 특성 배열에 저장하는 기능; (c) 감시 대상 세션의 복합 특성 벡터 연산부에서 상기 하나의 HTTP 요청에 따라 생성되는 새로이 가공된 형태의 웹 로그로부터 개별 감시 대상 특성 정보 및 전체 사용자 평균 특성 정보를 추출하고, 현재 감시 대상 세션과 전체 사용자 사이의 복합 특성 벡터(CAV)를 산출하며, 하나의 HTTP 요청에 따른 웹 로그로부터 현재 감시 대상 세션의 평균과 갱신된 전체 사용자의 평균과의 상대적 차이(γ)를 이용하여 각도 성분(α)과 길이 성분(β)을 정규화하여 계산하고, 정규화된 각도 성분과 길이 성분을 가중치 평균과 길이 가중치를 부과하여 복합 특성 벡터(CAV)의 각도와 길이로 산출하며, 하나의 현재 HTTP 요청에 대한 CAV값과 이를 포함한 기존 이전 요청까지의 감시 대상 세션 전체의 CAV값의 벡터합을 통한 현재 감시 대상 세션의 CAV값을 갱신하는 기능; (d) 비교 분석부에서 마지막 HTTP 요청에 의한 결과가 반영된 CAV 값을 바탕으로 현재 감시 대상 세션과 전체 사용자의 복합 특성 벡터값의 상대적인 차이를 근거로 극좌표계상에 정의된 각도 영역에 따라 웹 로봇 여부를 판단하고 길이성분으로 결과에 대한 신뢰도를 확인하며, 웹 로봇인지 정상 사용자인지를 판별하여 탐지된 결과를 경고 및 보고부로 제공하는 기능; 및 (e) 경고 및 보고부가 상기 비교분석부로부터 상기 웹 로봇인지 정상 사용자인지에 대한 탐지된 결과를 수신받아 모니터링 시스템으로 제공하는 기능;을 실현하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|