1 |
1
기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법에 있어서,연산처리수단에서, 기계학습을 위한 학습 데이터 생성을 위해 입력된 빅데이터 셋에 포함된 패킷 데이터들을 분석하여, 각각의 패킷 데이터에 대해, 기설정된 복수의 특성정보 항목을 추출하는 특성 추출 단계(S100);연산처리수단에서, 상기 특성 추출 단계(S100)에 의해 추출한 상기 특성정보 중 서비스 타입 정보에 따라, 상기 빅데이터 셋을 분할하여 적어도 둘 이상의 제1 서브 데이터 셋을 생성하는 제1 파티셔닝 단계(S200);연산처리수단에서, 상기 특성 추출 단계(S100)에 의해 추출한 상기 특성정보 중 목적지 포트 정보에 따라, 상기 제1 파티셔닝 단계(S200)에 의한 각각의 상기 제1 서브 데이터 셋을 분할하여, 각 상기 제1 서브 데이터 셋마다 하나 이상의 제2 서브 데이터 셋을 생성하는 제2 파티셔닝 단계(S300);연산처리수단에서, 기저장된 제1 결합 선호도 함수를 이용하여 상기 제2 파티셔닝 단계(S300)에 의한 상기 제2 서브 데이터 셋들 간의 결합 선호도를 연산하여, 연산 결과에 따른 상기 제2 서브 데이터 셋들의 결합을 통해 하나 이상의 제3 서브 데이터 셋을 생성하는 제1 머징 단계(S400);연산처리수단에서, 상기 특성 추출 단계(S100)에 의해 추출한 상기 특성정보 중 세션 플래그 정보에 따라, 상기 제1 머징 단계(S400)에 의한 각각의 상기 제3 서브 데이터 셋을 분할하여, 각 상기 제3 서브 데이터 셋마다 하나 이상의 제4 서브 데이터 셋을 생성하는 제3 파티셔닝 단계(S500); 및연산처리수단에서, 기저장된 제2 결합 선호도 함수를 이용하여 상기 제3 파티셔닝 단계(S500)에 의한 상기 제4 서브 데이터 셋들 간의 결합 선호도를 연산하여, 연산 결과에 따른 상기 제4 서브 데이터 셋들의 결합을 통해 하나 이상의 제5 서브 데이터 셋을 생성하는 제2 머징 단계(S600);를 포함하고,연산처리수단에서, 상기 제2 머징단계(S600)에 의한 각각의 상기 제5 서브 데이터 셋의 파티션 크기를 분석하여, 추가 분할 필요 여부를 판단하는 판단 단계;를 더 포함하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|
2 |
2
제 1항에 있어서,상기 판단 단계는상기 제2 머징단계(S600)에 의한 각각의 상기 제5 서브 데이터 셋의 파티션 크기를 분석하여, 파티션 크기가 기설정된 최소 파티션 크기보다 작을 경우, 해당하는 상기 제5 서브 데이터 셋에 대한 추가 분할이 필요하지 않는 것으로 판단하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|
3 |
3
제 2항에 있어서,상기 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법은연산처리수단에서, 상기 판단 단계의 결과에 따라, 파티션 크기가 기설정된 최대 파티션 크기보다 클 경우, 추가 분할이 필요한 것으로 판단하여, 해당하는 상기 제5 서브 데이터 셋에 대한 기설정된 파티셔닝 파라미터를 추출하는 계수 추출 단계(S700); 및연산처리수단에서, 기저장된 분리 선호도 함수를 이용하여 상기 계수 추출 단계(S700)에 의해 추출한 파티셔닝 파라미터를 적용하여, 해당하는 상기 제5 서브 데이터 셋을 분할하여 각 상기 제5 서브 데이터 셋마다 하나 이상의 제6 서브 데이터 셋을 생성하는 제4 파티셔닝 단계(S800);를 더 포함하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|
4 |
4
제 3항에 있어서,상기 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법은상기 판단 단계의 결과에 따라, 상기 제5 서브 데이터 셋 또는 제6 서브 데이터 셋을 이용하여 학습 데이터를 생성하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|
5 |
5
제 1항에 있어서,상기 제1 머징 단계(S400)는하기의 식과 같은 상기 제1 결합 선호도 함수를 통해, 상기 제2 서브 데이터 셋에 해당하는 목적지 포트 정보 중 공통 포트 번호의 수를 이용하여, 선택되는 두 개의 제2 서브 데이터 셋들 간의 결합 선호도를 연산하여, 상기 제3 서브 데이터 셋을 생성하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|
6 |
6
제 1항에 있어서,상기 제2 머징 단계(S600)는하기의 식과 같은 상기 제2 결합 선호도 함수를 통해, 상기 제4 서브 데이터 셋에 해당하는 세션 플래그를 이용하여, 선택되는 두 개의 제4 서브 데이터 셋들 간의 결합 선호도를 연산하여, 상기 제5 서브 데이터 셋을 생성하는 기계학습 기반 네트워크 침입 탐지를 위한 이중 파티셔닝 기법을 이용한 학습 데이터 생성 방법
|