1 |
1
유입된 데이터에 포함된 문자열을 해싱하여 해쉬값을 생성하는 단계;
화이트리스트로서 사용되는 문자열들에 대한 인덱스가 저장된 비트벡터 테이블로부터, 상기 해쉬값과 동일한 값을 갖는 화이트리스트 인덱스를 검색하는 단계;
검색된 화이트리스트 인덱스에 대응하는 문자열과, 상기 데이터의 문자열을 매칭하는 단계; 및
상기 데이터의 문자열과 순서가 동일한 문자열이 상기 화이트리스트 인덱스에 대응하는 문자열에 포함되는 경우, 상기 데이터가 화이트리스트에 포함되는 것으로 판단하여 상기 데이터를 정규데이터로 처리하는 단계;를 포함하는 문자열 포함성 결정 방법
|
2 |
2
제 1 항에 있어서,
상기 데이터에 대한 문자열 해싱 및 화이트리스트 인덱스 검색을, 상기 데이터에 포함된 마지막 문자열까지 반복 수행하여,
상기 해쉬값과 동일한 값을 갖는 화이트리스트 인덱스가 존재하지 않는 경우, 상기 데이터가 상기 화이트 리스트에 포함되지 않는 것으로 판단하고, 상기 데이터를 폐기 또는 패스하는 단계를 더 포함하는 문자열 포함성 결정 방법
|
3 |
3
제 2 항에 있어서,
상기 화이트리스트 인덱스를 검색하는 경우, 등록된 화이트리스트의 수에 대응하여 상기 비트벡터 테이블의 처음부터 마지막 화이트리스트 인덱스까지 상기 해쉬값과 동일한 값을 갖는 화이트리스트 인덱스를 검색하는 것을 특징으로 하는 문자열 포함성 결정 방법
|
4 |
4
제 1 항에 있어서,
상기 매칭 결과, 상기 데이터의 문자열과, 상기 화이트리스트 인덱스에 대응하는 문자열의 순서가 상이한 경우, 상기 데이터가 상기 화이트리스트에 포함되지 않는 것으로 판단하여 상기 데이터를 폐기 또는 패스하는 단계를 더 포함하는 문자열 포함성 결정 방법
|
5 |
5
제 1 항에 있어서,
상기 데이터에 포함된 문자열에 대하여, 슬라이딩 윈도우(Sliding-window) 기법에 따라 컨시큐티브 해싱(Consecutive n-gram Hashing) 방식으로 해싱하는 것을 특징으로 하는 문자열 포함성 결정 방법
|
6 |
6
화이트리스트에 등록할 문자열이 포함된 데이터가 입력되는 단계;
상기 데이터의 문자열을 해싱하고 생성된 해쉬값에 대응하는 화이트리스트 인덱스를 비트벡터 테이블로부터 검색하여, 상기 데이터가 상기 화이트리스트에 포함되는지 여부를 판단하는 단계;
상기 데이터가 새로운 데이터인 경우, 상기 문자열을 상기 화이트리스트에 등록하는 단계; 및
상기 데이터가 상기 화이트리스트에 이미 포함된 경우, 등록된 데이터임을 나타내는 결과값과, 상기 데이터에 대응하는 화이트리스트 인덱스를 출력하는 단계를 포함하는 문자열 포함성 결정 방법
|
7 |
7
제 6 항에 있어서,
상기 데이터가 상기 화이트리스트에 포함되는지 여부를 판단하는 경우,
슬라이딩 윈도우 기법에 따라 컨시큐티브 해싱(Consecutive n-gram Hashing) 방식을 이용하여 상기 데이터의 문자열을 해싱하고,
상기 해쉬값에 대응하는 비트벡터 테이블에서, 값이 1인 화이트리스트 인덱스가 적어도 하나 존재하는 경우, 상기 데이터가 상기 화이트리스트에 포함된 것으로 판단하는 것을 특징으로 하는 문자열 포함성 결정 방법
|
8 |
8
제 7 항에 있어서,
상기 해쉬값에 대응하는 비트벡터 테이블에서, 값이 1 인 화이트리스트 인덱스가 존재하지 않는 경우, 상기 데이터가 상기 화이트리스트에 포함되지 않은 새로운 데이터인 것으로 판단하는 것을 특징으로 하는 문자열 포함성 결정 방법
|
9 |
9
제 6 항에 있어서,
상기 데이터가 새로운 데이터인 경우, 슬라이딩 윈도우 기법에 따라 오버랩핑 해싱(Overlapping n-gram hashing) 방식을 이용하여 상기 데이터의 문자열을 해싱하고,
생성된 해쉬값에 대응하는 비트벡터테이블을 갱신하여 상기 데이터의 문자열을 상기 화이트리스트에 등록하는 것을 특징으로 하는 문자열 포함성 결정 방법
|
10 |
10
유입된 데이터를 슬라이딩 윈도우 기법에 따라 컨시큐티브 해싱(Consecutive n-gram Hashing) 또는 오버랩핑 해싱(Overlapping n-gram ashing) 방식으로 해싱하는 해싱부;
상기 해싱부에서 생성된 해쉬값과 동일한 값을 갖는 화이트리스트 인덱스를 비트벡터테이블로부터 검색하여 상기 데이터의 화이트리스트 포함 여부를 판단하는 데이터 탐색부;
상기 데이터가 화이트리스트에 추가할 문자열을 포함하는 새로운 데이터인 경우, 상기 해쉬값에 대응하는 비트벡터테이블을 갱신하여 상기 데이터를 화이트리스트에 등록하는 화이트리스트 관리부; 및
상기 화이트리스트 관리부에 의한 등록을 제어하고, 상기 데이터 탐색부의 판단결과에 대응하여 상기 데이터를 폐기하거나 또는 유지하는 제어부를 포함하는 문자열 포함성 결정 장치
|