1 |
1
악성코드 탐지를 위한 특성선정 장치에 의해 수행되는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법에 있어서,안드로이드 환경에서 각 어플리케이션의 특성정보()의 집합(IFS: Initial Feature Set)을 생성하는 단계;상기 특성정보()를 악성코드와 연관성이 높은 순서대로 순위를 산정하여 랭크값()을 부여하는 단계;상기 특성정보()를 포함하고 있는 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()를 산출하는 단계;상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()를 이용하여 악성 어플리케이션의 분포율과 정상 어플리케이션의 분포율을 산출하고, 각각 기 설정된 분포율 임계값과 비교하는 단계;상기 비교한 결과에 따라 상기 특성정보()의 랭크값()에 가중치(w)를 부여하는 단계; 및상기 가중치가 부여된 랭크값()의 크기에 따라 상기 특성정보()를 최종 특성선정 집합(DFS: Derived Feature Set)으로 분류하는 단계;를 포함하고,상기 각각 기 설정된 분포율 임계값과 비교하는 단계는,상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()의 합 중에서 상기 악성 어플리케이션의 개수()의 비율인 악성 어플리케이션의 분포율()을 산출하는 단계;상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()의 합 중에서 상기 정상 어플리케이션의 개수()의 비율인 정상 어플리케이션의 분포율()을 산출하는 단계;상기 악성 어플리케이션의 분포율()을 기 설정된 악성 어플리케이션 분포율 임계값()과 비교하는 단계; 및상기 정상 어플리케이션의 분포율()을 기 설정된 정상 어플리케이션 분포율 임계값()과 비교하는 단계;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 가중치(w)를 부여하는 단계는,산출된 악성 어플리케이션의 분포율() 및 정상 어플리케이션의 분포율()이 각각 기 설정된 분포율 임계값(, )을 초과하는 경우, 상기 특성정보()의 랭크값()에 가중치(w)를 부여하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법
|
4 |
4
제1항에 있어서,상기 최종 특성선정 집합으로 분배하는 단계는,상기 가중치가 부여된 랭크값()을 기 설정된 특성정보 임계값()과 비교하는 단계;상기 가중치가 부여된 랭크값()이 상기 특성정보 임계값()을 만족하는 경우, 상기 가중치가 부여된 랭크값()인 특성정보()를 결과값(F)으로 산출하는 단계; 및상기 결과값을 최종 특성선정 집합으로 저장하는 단계;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법
|
5 |
5
제1항에 있어서,상기 특성정보()의 집합을 생성하는 단계는,상기 어플리케이션의 프로그래밍 소스로부터 수행과정을 암시하는 적어도 하나의 특성을 추출하는 단계; 및상기 추출된 특성의 순서(i)를 랜덤으로 설정하여 특성정보()로 저장하는 단계;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법
|
6 |
6
제1항 및 제3항 내지 제5항 중 어느 하나의 항에 따른 머신러닝 기반 악성코드 탐지를 위한 특성선정 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체
|
7 |
7
안드로이드 환경에서 각 어플리케이션의 모든 수행과정을 암시하는 특성정보()의 집합(IFS: Initial Feature Set)을 추출하는 정보 생성부;상기 특성정보()를 악성코드와 연관성이 높은 순서대로 순위를 산정하여 랭크값()을 부여하는 랭크 산정부;상기 특성정보()를 포함하고 있는 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()를 산출하는 개수 산출부;상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()를 이용하여 악성 어플리케이션의 분포율과 정상 어플리케이션의 분포율을 산출하고, 각각 기 설정된 분포율 임계값과 비교하는 분포율 비교부;상기 분포율 비교부의 결과에 따라 상기 특성정보()의 랭크값()에 가중치(w)를 부여하는 가중치 부여부; 및상기 가중치가 부여된 랭크값()의 크기에 따라 상기 특성정보()를 최종 특성선정 집합(DFS: Derived Feature Set)으로 분류하는 최종 분배부;를 포함하고,상기 분포율 비교부는,상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()의 합 중에서 상기 악성 어플리케이션의 개수()의 비율인 악성 어플리케이션의 분포율()을 산출하는 악성분포율 산출부;상기 악성 어플리케이션의 개수()와 정상 어플리케이션의 개수()의 합 중에서 상기 정상 어플리케이션의 개수()의 비율인 정상 어플리케이션의 분포율()을 산출하는 정상분포율 산출부;상기 악성 어플리케이션의 분포율()을 기 설정된 악성 어플리케이션 분포율 임계값()과 비교하는 제1 비교부; 및상기 정상 어플리케이션의 분포율()을 기 설정된 정상 어플리케이션 분포율 임계값()과 비교하는 제2 비교부;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 장치
|
8 |
8
삭제
|
9 |
9
제7항에 있어서,상기 가중치 부여부는,상기 산출된 악성 어플리케이션의 분포율() 및 정상 어플리케이션의 분포율()이 각각 기 설정된 분포율 임계값(, )을 초과하는 경우, 상기 특성정보()의 랭크값()에 가중치(w)를 부여하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 장치
|
10 |
10
제7항에 있어서,상기 최종 분배부는,상기 가중치(w)가 부여된 랭크값()과 기 설정된 특성정보 임계값()을 비교하는 제3 비교부;상기 가중치가 부여된 랭크값()이 상기 특성정보 임계값()을 만족하는 경우, 상기 가중치가 부여된 랭크값()인 특성정보()를 결과값(F)으로 산출하는 결과값 산출부; 및상기 결과값(F)을 최종 특성선정 집합으로 저장하는 특성선정 결정부;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 장치
|
11 |
11
제7항에 있어서,상기 정보 생성부는,상기 어플리케이션의 프로그래밍 소스로부터 수행과정을 암시하는 특성을 추출하는 특성 추출부; 및상기 추출된 특성의 순서(i)를 랜덤으로 설정하여 특성정보()로 저장하는 저장부;를 포함하는, 머신러닝 기반 악성코드 탐지를 위한 특성선정 장치
|