1 |
1
유입되는 패킷으로부터 시그니처를 생성하기 위하여, 상기 패킷을 미리 설정된 임의의 크기를 갖는 컨텐츠 단위로 토큰화 하는 과정;
상기 토큰화된 개별 컨텐츠의 집합으로 시그니처 컨텐츠를 생성하고, 상기 시그니처 컨텐츠에 대한 축약데이터를 생성하는 과정;
상기 축약데이터를 기존 축약데이터와 비교하여, 상기 축약데이터가 상기 기존 축약데이터에 포함되는지 여부, 또는 상기 축약데이터가 소정 기준 이상 상기 기존 축약데이터와 유사한지 여부에 따라, 상기 시그니처 컨텐츠를 기존 트리에 추가하거나 또는 새로운 트리에 삽입하여, 상기 시그니처 컨텐츠를 트리에 분류하는 과정; 및
상기 시그니처 컨텐츠로 이루어진 트리를 바탕으로 생성된, 시그니처 스트링의 기록을 별도로 저장하고, 미리 설정된 소정 주기의 시간마다 상기 트리를 리셋하는 과정을 포함하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
2 |
2
제 1 항에 있어서, 상기 분류과정은,
상기 축약데이터가 상기 기존 축약데이터에 포함되지 않으나 소정 기준 이상 비슷하여 유사한 경우, 상기 기존 축약데이터가 포함된 트리에 새로운 노드로 상기 시그니처 컨텐츠를 추가하며,
포함되지 않고 유사하지 않은 경우, 축약데이터 리스트에 상기 축약데이터를 추가하고, 새로운 트리를 생성하여 상기 시그니처 컨텐츠를 삽입하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
3 |
3
제 2 항에 있어서,
상기 시그니처 컨텐츠를 상기 기존 축약데이터의 트리에 새로운 노드로써 추가하는 경우, 상기 기존 축약데이터의 트리 중, 가장 마지막 노드에 기록되는 힛(hit) 수를 증가하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
4 |
4
제 2 항에 있어서,
상기 축약데이터가 상기 기존 축약데이터에 포함되는 경우, 상기 기존 축약데이터가 포함된 트리에 상기 시그니처 컨텐츠를 추가하지 않고 상기 기존 축약데이터가 포함된 트리의 가장 마지막 노드에 기록되는 힛(Hit)수를 증가하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
5 |
5
제 1 항에 있어서,
상기 축약데이터가 상기 기존 축약데이터에 포함되는지 여부를 나타내는 포함성은, Jaccard Index를 이용한 다음의 수학식을 바탕으로 계산되는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
6 |
6
제 1 항에 있어서,
상기 축약데이터가 소정 기준 이상 상기 기존 축약데이터와 유사한지 여부를 나타내는 유사성은, Jaccard Index를 이용한 다음의 수학식을 바탕으로 계산되는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
7 |
7
제 1 항에 있어서,
상기 시그니처 컨텐츠에 라빈 핑거프린트(RF)를 적용하여 상기 축약데이터를 생성하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
8 |
8
제 2 항에 있어서,
상기 축약데이터 리스트는 포함된 각 축약데이터에 대하여, 링크드 리스트 형태로 트리의 주소가 맵핑되는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
9 |
9
유입된 데이터 패킷으로부터 토큰화된, 시그니처 컨텐츠의 축약데이터간의 포함성 또는 소정 기준 이상의 유사성에 대응하여 시그니처 스트링을 이룰 트리에 상기 시그니처 컨텐츠를 배치하는 과정;
각 트리별로 포함된 적어도 하나의 시그니처 컨텐츠에 대하여 공통되는 순열을 추출하는 과정;
상기 추출된 순열을 바탕으로 멀티컨텐츠 형태의 시그니처 스트링을 생성하는 과정; 및
상기 시그니처 스트링의 축약데이터를 생성하여, 기존의 시그니처 스트링의 축약데이터와 비교하고, 비교 결과에 대응하여 상기 시그니처 스트링의 축약데이터가 상기 기존의 시그니처 스트링의 축약데이터와 동일하지 않은 경우 상기 시그니처 스트링을 유해패킷 판별을 위한 데이터로 등록하는 과정을 포함하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
10 |
10
제 9 항에 있어서,
상기 순열추출과정은 상기 각 트리에 대해 LCS(Longest Common 서브시퀀스)를 판별하여 상기 시그니처 컨텐츠에 대한 공통되는 순열을 추출하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
11 |
11
제 9 항에 있어서,
상기 비교결과에 대응하여 상기 시그니처 스트링의 축약데이터가 상기 기존의 시그니처 스트링의 축약데이터와 동일하지 않은 경우, 리셋되는 트리에 대한 시그니처의 기록으로써 상기 시그니처 스트링의 축약데이터를 별도 저장하는 과정을 더 포함하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|
12 |
12
제 11 항에 있어서,
상기 비교결과에 대응하여 상기 시그니처 스트링의 축약데이터가 상기 기존의 시그니처 스트링의 축약데이터와 동일하다고 판단되는 경우, 시그니처 스트링의 중복생성을 방지하기 위해, 상기 기존의 시그니처 스트링에 대한 중복생성 카운트수를 증가하는 것을 특징으로 하는 문자열의 유사성과 포함성을 바탕으로 하는 시그니처 스트링 생성방법
|