1 |
1
각 플로우의 소정 패킷의 초기 P바이트를 기설정된 워드(Word) 단위로 구분하고, 기설정된 횟수 이상 반복되는 워드를 선별하는 전처리부;선별된 워드를 이용하여 LDA(Latent Dirichlet Allocation) 토픽 모델링하여 상기 각 플로우의 토픽-여기서, 상기 토픽은 응용프로그램임-을 추출하는 토픽 모델링부;상기 선별된 워드로부터 추출된 상기 토픽별 워드 분포도가 높은 순으로 상기 워드를 정렬하고, 상기 분포도가 높은 순으로 정렬된 워드 중 상위 L번째까지 L개의 워드를 추출하는 선별부; 및추출된 상기 L개의 워드를 상기 각 플로우의 페이로드와 직접 매칭하여 상기 각 플로우의 상기 토픽을 할당하는 매칭부를 포함하는 트래픽 분류 장치
|
2 |
2
제1항에 있어서, 상기 매칭부는,상기 직접 매칭 결과, 상기 각 플로우 중에서, 상기 토픽에 할당되지 않은 플로우의 추출된 L개의 워드를 상기 토픽 모델링부에 재입력시켜, 복수 단계의 토픽 할당을 수행하는 것인 트래픽 분류 장치
|
3 |
3
제2항에 있어서, 상기 매칭부는,상기 직접 매칭을 통해 상기 토픽에 할당되는 플로우가 하나도 없으면, 상기 복수 단계의 토픽 할당을 수행하지 않는 것인 트래픽 분류 장치
|
4 |
4
제1항에 있어서, 상기 전처리부는, 기설정된 표준 포트를 이용하는 패킷들은 분류 및 필터링하는 필터에 의해 분류되지 않은 비표준 포트를 이용하여 패킷을 포함하는 상기 각 플로우를 입력받는 것인 트래픽 분류 장치
|
5 |
5
제1항에 있어서, 상기 플로우의 소정 패킷은,페이로드를 포함하는 것인 트래픽 분류 장치
|
6 |
6
트래픽 분류 장치에 의한 트래픽 분류 방법으로서,각 플로우의 소정 패킷의 페이로드에서 초기 P바이트를 기설정된 워드 길이 W 단위로 분할하는 단계;분할된 복수의 워드에서 기설정된 임계치 이상 반복되는 적어도 하나의 워드를 선별하는 단계;선별된 상기 적어도 하나의 워드를 LDA(Latent Dirichlet Allocation) 토픽 모델링하여 상기 각 플로우의 토픽을 추출하는 단계;상기 선별된 워드로부터 추출된 상기 토픽별 워드 분포도가 높은 순으로 상기 워드를 정렬하고, 상기 분포도가 높은 순으로 정렬된 워드 중 상위 L번째까지 L개의 워드를 추출하는 단계; 및추출된 상기 L개의 워드를 상기 각 플로우의 페이로드에 직접 매칭(Direct Matching)시켜, 상기 각 플로우의 응용프로그램을 구분하는 단계를 포함하는 트래픽 분류 방법
|
7 |
7
제6항에 있어서, 상기 구분하는 단계에서, 상기 각 플로우 중에서 상기 응용프로그램별로 분류되지 않은 플로우의 L개의 워드에 대해, 상기 토픽을 추출하는 단계, 상기 워드를 추출하는 단계 및 상기 응용프로그램의 시그니처를 선별하는 단계를 더 수행하는 것인 트래픽 분류 방법
|
8 |
8
제6항에 있어서, 상기 분할하는 단계 이전에,기설정된 표준 포트를 이용하는 패킷들은 미리 분류하여 필터링하는 단계; 및상기 필터링하는 단계에서 분류되지 않은 비표준 포트를 이용하여 패킷에 대해서 상기 각 플로우를 확인하는 단계를 더 포함하며,상기 각 플로우는, 상기 비표준 포트를 이용하는 패킷을 포함하는 것인 트래픽 분류 방법
|