1 |
1
사전 압축(Dictionary Encoding)된 텍스트 데이터의 압축 방식을 식별하는 방법에 있어서,입력부가 사전 압축 방식으로 압축된 텍스트 데이터를 입력 받는 데이터입력단계;전역적 특징 추출부가 CNN(Convolutional Neural Network)을 기반으로 상기 입력된 텍스트 데이터의 전역적 특징을 추출하는 전역적특징추출단계;지역적 특징 추출부가 상기 전역적 특징으로부터 상기 입력된 텍스트 데이터의 지역적 특징들을 적어도 두 가지 이상 추출하는 지역적특징추출단계;특징벡터 추출부가 상기 추출된 지역적 특징들로부터 특징벡터를 추출하고, 상기 특징벡터에 대해 풀리커넥티드 레이어를 통해 결과벡터를 추출하는 특징벡터추출단계; 및연산부가 상기 추출된 결과벡터를 기반으로 상기 텍스트 데이터의 압축 방식을 식별하는 연산을 수행하는 연산단계를 포함하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 방법
|
2 |
2
제 1항에 있어서,상기 데이터입력단계는,일련의 ASCII(American Standard Code for Information Interchange) 코드로 표현된 상기 압축된 텍스트 데이터를 미리 설정된 규칙에 따라 숫자열로 변환하고, 상기 변환된 숫자열을 구성하는 각각의 숫자를 미리 설정된 범위의 숫자로 변환하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 방법
|
3 |
3
제 1항에 있어서,상기 지역적특징추출단계는,적어도 두 가지 이상의 컨볼루션 필터들을 이용하여 상기 전역적 특징에 대해 상기 적어도 두 가지 이상의 컨볼루션 필터들에 대응되는 지역적 특징들을 추출하고,상기 입력된 텍스트 데이터의 크기에 무관하게 미리 설정된 개수의 상기 지역적 특징들을 추출하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 방법
|
4 |
4
제 1항에 있어서,상기 특징벡터추출단계는,상기 입력된 텍스트 데이터의 크기에 무관하게 미리 설정된 길이의 상기 특징벡터를 추출하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 방법
|
5 |
5
제 1항 내지 제 4항 중 어느 한 항에 따른 방법을 실행시키기 위한 프로그램을 저장하고 있는 컴퓨터 판독 가능한 기록매체
|
6 |
6
사전 압축된 텍스트 데이터의 압축 방식을 식별하는 시스템에 있어서,사전 압축 방식으로 압축된 텍스트 데이터를 입력 받는 입력부;CNN을 기반으로 상기 입력된 텍스트 데이터의 전역적 특징을 추출하는 전역적 특징 추출부;상기 전역적 특징으로부터 상기 입력된 텍스트 데이터의 지역적 특징들을 적어도 두 가지 이상 추출하는 지역적 특징 추출부;상기 추출된 지역적 특징들로부터 특징벡터를 추출하고, 상기 특징벡터에 대해 풀리커넥티드 레이어를 통해 결과벡터를 추출하는 특징벡터 추출부; 및상기 추출된 결과벡터를 기반으로 상기 텍스트 데이터의 압축 방식을 식별하는 연산을 수행하는 연산부를 포함하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 시스템
|
7 |
7
제 6항에 있어서,상기 입력부는,일련의 ASCII 코드로 표현된 상기 압축된 텍스트 데이터를 미리 설정된 규칙에 따라 숫자열로 변환하고, 상기 변환된 숫자열을 구성하는 각각의 숫자를 미리 설정된 범위의 숫자로 변환하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 시스템
|
8 |
8
제 6항에 있어서,상기 지역적 특징 추출부는,적어도 두 가지 이상의 컨볼루션 필터들을 이용하여 상기 전역적 특징에 대해 상기 적어도 두 가지 이상의 컨볼루션 필터들에 대응되는 지역적 특징들을 추출하고,상기 입력된 텍스트 데이터의 크기에 무관하게 미리 설정된 개수의 상기 지역적 특징들을 추출하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 시스템
|
9 |
9
제 6항에 있어서,상기 특징벡터 추출부는,상기 입력된 텍스트 데이터의 크기에 무관하게 미리 설정된 길이의 상기 특징벡터를 추출하는, 사전 압축된 텍스트 데이터의 압축 방식을 식별하는 시스템
|