1 |
1
DGA 생성 도메인 탐지 및 분류 방법에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
2 |
2
제1항에 있어서,상기 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현되는 벡터인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
3 |
3
제2항에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하기 전에, 도메인주소가 전처리되며, 상기 전처리는 먼저, 도메인주소의 문자열을 문자 단위로 분할하고, 분할된 각 문자에 대응하는 순서번호에 맞게 문자가 치환되며, 치환된 순서번호 벡터의 길이가 100보다 짧으면 패딩 순서번호 0번을 붙여 길이 100으로 만들고, 만약 순서벡터의 길이가 100보다 길면 초과된 순서번호를 벡터를 잘라내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
4 |
4
제3항에 있어서,상기 원 핫 벡터를 통해 100 * 69 크기의 벡터로 표현되는 도메인주소를 얻게 되고, 이 도메인주소에 콘볼루션 과정이 행해지는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
5 |
5
제4항에 있어서,상기 콘볼루션 과정은 콘볼루션 레이어와 맥스풀링 레이어의 반복으로 이루어지는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
6 |
6
제5항에 있어서,상기 콘볼루션 레이어는 입력된 벡터에 대해 정해진 크기의 필터를 이용하여 합성곱을 진행하고, 상기 레이어는 벡터의 크기(M), 필터의 크기(K), 필터의 개수(F) 및 스트라이드(S)의 파라미터를 포함하고, 상기 스트라이드는 필터의 이동의 정도를 나타내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
7 |
7
제5항에 있어서,상기 맥스폴링 레이어는 입력된 벡터의 국소영역에서 최대값만을 보존하여 벡터의 크기를 축소시키는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
8 |
8
제4항에 있어서,콘볼류션 레이어와 맥스풀링 레이터를 2차례 반복하며, 상기 반복과정은,(a) 첫 번째 콘볼루션 레이어가 100 * 69 크기의 벡터를 입력받아, 5 * 69의 크기를 가지는 256개의 필터와, 스트라이드 값 1을 사용하여 96 * 256 크기의 벡터를 생성하며,(b) 첫 번째 맥스풀링 레이어가 상기 단계 (a)의 96 * 256 크기의 벡터에 대해 2 * 256 크기의 국소영역에 대해 맥스풀링을 진행하여, 256개의 48 * 256 크기의 벡터를 출력하고,(c) 두 번째 콘볼루션 레이어가 상기 단계 (b)의 48 * 256크기의 벡터를 입력받아, 3 * 256크기를 가지는 256개의 필터와, 스트라이드 값 1을 사용하여 46 * 256 크기의 벡터를 생성하며,(d) 두 번째 맥스풀링 레이어가 상기 단계 (c)의 46 * 256 크기의 벡터에 대해 2 * 256 크기의 국소영역에 대해 맥스풀링을 진행하여 23 * 256 크기를 벡터를 출력하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
9 |
9
제8항에 있어서,상기 반복된 콘볼루션 과정을 통해 얻은 23 * 256 크기의 벡터를 한 줄의 벡터(풀 레이어)로 변환하여, 5888 크기의 풀 레이어를 얻는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
10 |
10
제9항에 있어서,상기 풀 레이어에 4번의 ANN 과정을 거쳐 20개의 DGA 분류를 예측하며, 각 ANN 레이어의 노드 수는 각각 512개, 512개, 100개 및 20개인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
11 |
11
제10항에 있어서,상기 TextCNN의 ANN 레이어에서 100개 노드를 가지는 3번째 레이어로부터 100개의 특징정보를 추출하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
12 |
12
제8항에 있어서,도메인 명칭으로부터 8개의 지식을 추출하여 더해, 각 도메인 주소마다 108개의 벡터를 생성하며, 상기 8개의 지식은 각각 도메인 명칭에 존재하는 숫자의 비율과, 모음의 개수와, 하이픈 문자(-)와 언더바 문자(_)의 개수와, 보통명사의 포함 여부와, 보통명사의 개수와, [‘문자’,‘숫자’] 또는 [‘숫자’, ‘문자’] 패턴의 개수와, [‘자음’,‘자음’] 패턴의 개수와, [‘모음’,‘모음’] 패턴의 개수인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
13 |
13
제12항에서,보통명사의 포함 여부의 지식은, 도메인 명칭에 보통명사가 존재하지 않을 경우 0’자연어가 존재할 경우‘1’로 분류해 사용하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|
14 |
14
제12항에 있어서,상기 [‘문자’,‘숫자’] 또는 [‘숫자’, ‘문자’] 패턴의 개수는, 도메인 명칭을 2-gram으로 나누어 문자 이후 숫자가 연속되거나 숫자 이후 문자가 연속되는 패턴을 카운트한 수를 사용하고, 상기 [‘자음’,‘자음’] 패턴의 개수는, 도메인 명칭 2-gram으로 나누어 자음과 자음이 연속되는 패턴을 카운트한 수를 사용하며, 상기 [‘모음’,‘모음’] 패턴의 개수는, 도메인 명칭을 2-gram으로 나누어 모음과 모음이 연속되는 패턴을 카운트 한 수를 사용하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
|