맞춤기술찾기

이전대상기술

DGA 생성 도메인 탐지 및 분류 방법

  • 기술번호 : KST2022008124
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따른 DGA 생성 도메인 탐지 및 분류 방법은, TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내며, 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현되는 벡터이다. TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하기 전에, 도메인주소가 전처리되며, 상기 전처리는 먼저, 도메인주소의 문자열을 문자 단위로 분할하고, 분할된 각 문자에 대응하는 순서번호에 맞게 문자가 치환되며, 치환된 순서번호 벡터의 길이가 100보다 짧으면 패딩 순서번호 0번을 붙여 길이 100으로 만들고, 만약 순서벡터의 길이가 100보다 길면 초과된 순서번호를 벡터를 잘라낸다. Text CNN에서 콘볼루션 과정은 콘볼루션 레이어와 맥스풀링 레이어의 반복으로 이루어지며, 콘볼루션 레이어는 입력된 벡터에 대해 정해진 크기의 필터를 이용하여 합성곱을 진행하며, 맥스폴링 레이어는 입력된 벡터의 국소영역에서 최대값만을 보존하여 벡터의 크기를 축소하며, 콘볼루션 과정을 통해 얻은 벡터를 한 줄의 벡터(풀 레이어)로 변환하여, 512, 512, 100 그리고 20 의 노드를 가지는 레이어들로 구성된 ANN을 통해서 DGA 탐지 및 분류 수행한다. 학습된 모델로부터 ANN구조의 3번째 레이어를 추출한 100개의 특징정보와 도메인 주소의 문자열 정보로부터 알 수 있는 정보를 8개의 특징정보를 합한 108개의 특징정보를 입력으로 하는 LightGbm 모델을 이용한 DGA 탐지 및 분류한다.
Int. CL G06K 9/00 (2022.01.01) H04L 9/40 (2022.01.01) H04L 61/00 (2022.01.01) G06V 10/46 (2022.01.01) G06K 9/62 (2022.01.01) G06N 3/08 (2006.01.01)
CPC G06V 30/40(2013.01) H04L 63/1416(2013.01) H04L 61/4511(2013.01) H04L 2101/30(2013.01) G06V 10/469(2013.01) G06K 9/627(2013.01) G06N 3/08(2013.01) G06V 30/10(2013.01)
출원번호/일자 1020200165503 (2020.12.01)
출원인 호서대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0076723 (2022.06.08) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.12.01)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 호서대학교 산학협력단 대한민국 충청남도 아산시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이태진 서울특별시 송파구
2 황찬웅 경기도 시흥시 중심상가로
3 김효식 경기도 평택시

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 조경화 대한민국 서울특별시 강남구 강남대로***길 **, ***호 (논현동)(국제특허법률사무소미래연)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.12.01 수리 (Accepted) 1-1-2020-1297783-14
2 선행기술조사의뢰서
Request for Prior Art Search
2021.03.19 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
DGA 생성 도메인 탐지 및 분류 방법에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하고, 순서번호 벡터 요소와 대응하는 원 핫 벡터와 치환하여 이미지의 표현으로 나타내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
2 2
제1항에 있어서,상기 원 핫 벡터는 68개의 문자와 식별할 수 없는 문자 1개를 포함한 69개의 문자에 대한 순서번호와, 패딩을 표현할 순서번호 0을 추가한 70개의 순서번호를 사용하여, 70개 순서번호에 대응하는 69 길이의 원 핫 벡터이고, 여기서 0번 순서번호는 0으로 채워진 제로벡터이고, 순서번호 1 내지 69는 각 순서에 맞는 벡터요소가 1로 표현되는 벡터인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
3 3
제2항에 있어서,TextCNN에 순서번호의 벡터로 표현되는 도메인주소를 입력하기 전에, 도메인주소가 전처리되며, 상기 전처리는 먼저, 도메인주소의 문자열을 문자 단위로 분할하고, 분할된 각 문자에 대응하는 순서번호에 맞게 문자가 치환되며, 치환된 순서번호 벡터의 길이가 100보다 짧으면 패딩 순서번호 0번을 붙여 길이 100으로 만들고, 만약 순서벡터의 길이가 100보다 길면 초과된 순서번호를 벡터를 잘라내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
4 4
제3항에 있어서,상기 원 핫 벡터를 통해 100 * 69 크기의 벡터로 표현되는 도메인주소를 얻게 되고, 이 도메인주소에 콘볼루션 과정이 행해지는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
5 5
제4항에 있어서,상기 콘볼루션 과정은 콘볼루션 레이어와 맥스풀링 레이어의 반복으로 이루어지는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
6 6
제5항에 있어서,상기 콘볼루션 레이어는 입력된 벡터에 대해 정해진 크기의 필터를 이용하여 합성곱을 진행하고, 상기 레이어는 벡터의 크기(M), 필터의 크기(K), 필터의 개수(F) 및 스트라이드(S)의 파라미터를 포함하고, 상기 스트라이드는 필터의 이동의 정도를 나타내는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
7 7
제5항에 있어서,상기 맥스폴링 레이어는 입력된 벡터의 국소영역에서 최대값만을 보존하여 벡터의 크기를 축소시키는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
8 8
제4항에 있어서,콘볼류션 레이어와 맥스풀링 레이터를 2차례 반복하며, 상기 반복과정은,(a) 첫 번째 콘볼루션 레이어가 100 * 69 크기의 벡터를 입력받아, 5 * 69의 크기를 가지는 256개의 필터와, 스트라이드 값 1을 사용하여 96 * 256 크기의 벡터를 생성하며,(b) 첫 번째 맥스풀링 레이어가 상기 단계 (a)의 96 * 256 크기의 벡터에 대해 2 * 256 크기의 국소영역에 대해 맥스풀링을 진행하여, 256개의 48 * 256 크기의 벡터를 출력하고,(c) 두 번째 콘볼루션 레이어가 상기 단계 (b)의 48 * 256크기의 벡터를 입력받아, 3 * 256크기를 가지는 256개의 필터와, 스트라이드 값 1을 사용하여 46 * 256 크기의 벡터를 생성하며,(d) 두 번째 맥스풀링 레이어가 상기 단계 (c)의 46 * 256 크기의 벡터에 대해 2 * 256 크기의 국소영역에 대해 맥스풀링을 진행하여 23 * 256 크기를 벡터를 출력하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
9 9
제8항에 있어서,상기 반복된 콘볼루션 과정을 통해 얻은 23 * 256 크기의 벡터를 한 줄의 벡터(풀 레이어)로 변환하여, 5888 크기의 풀 레이어를 얻는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
10 10
제9항에 있어서,상기 풀 레이어에 4번의 ANN 과정을 거쳐 20개의 DGA 분류를 예측하며, 각 ANN 레이어의 노드 수는 각각 512개, 512개, 100개 및 20개인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
11 11
제10항에 있어서,상기 TextCNN의 ANN 레이어에서 100개 노드를 가지는 3번째 레이어로부터 100개의 특징정보를 추출하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
12 12
제8항에 있어서,도메인 명칭으로부터 8개의 지식을 추출하여 더해, 각 도메인 주소마다 108개의 벡터를 생성하며, 상기 8개의 지식은 각각 도메인 명칭에 존재하는 숫자의 비율과, 모음의 개수와, 하이픈 문자(-)와 언더바 문자(_)의 개수와, 보통명사의 포함 여부와, 보통명사의 개수와, [‘문자’,‘숫자’] 또는 [‘숫자’, ‘문자’] 패턴의 개수와, [‘자음’,‘자음’] 패턴의 개수와, [‘모음’,‘모음’] 패턴의 개수인 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
13 13
제12항에서,보통명사의 포함 여부의 지식은, 도메인 명칭에 보통명사가 존재하지 않을 경우 0’자연어가 존재할 경우‘1’로 분류해 사용하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
14 14
제12항에 있어서,상기 [‘문자’,‘숫자’] 또는 [‘숫자’, ‘문자’] 패턴의 개수는, 도메인 명칭을 2-gram으로 나누어 문자 이후 숫자가 연속되거나 숫자 이후 문자가 연속되는 패턴을 카운트한 수를 사용하고, 상기 [‘자음’,‘자음’] 패턴의 개수는, 도메인 명칭 2-gram으로 나누어 자음과 자음이 연속되는 패턴을 카운트한 수를 사용하며, 상기 [‘모음’,‘모음’] 패턴의 개수는, 도메인 명칭을 2-gram으로 나누어 모음과 모음이 연속되는 패턴을 카운트 한 수를 사용하는 것을 특징으로 하는 DGA 생성 도메인 탐지 및 분류 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정보보호핵심원천기술개발(R&D,정보화) 지능화된 악성코드 위협으로부터 ICT 인프라 보호