1 |
1
컴퓨팅 장치에 의해 수행되는 방법에 있어서,예측 대상 URL을 복수의 모델에 입력하여, 상기 모델 각각에 의한 예측 결과 및 상기 모델 각각의 성능 수치를 출력하는 단계; 및상기 출력된 모델 각각의 예측 결과 및 상기 모델 각각의 성능 수치에 기초하여 상기 예측 대상 URL이 악성 URL인지 여부를 예측하는 단계를 포함하고,상기 복수의 모델은, 수집된 URL로부터 추출된 URL 데이터, URL 콘텐츠 데이터, 및 URL 호스트 데이터를 이용하여 구성된 학습 데이터를 이용하여 서로 다른 복수의 기계 학습을 수행하여 생성된 것인, 다중 기계 학습 기반 악성 URL 예측 방법
|
2 |
2
제1 항에 있어서,상기 URL 데이터는, 상기 수집된 URL의 접속 페이지 내에 포함된 내부 URL 및 외부 URL을 포함하는, 다중 기계 학습 기반 악성 URL 예측 방법
|
3 |
3
제1 항에 있어서,상기 학습 데이터 중 URL 데이터의 경우, CNN 또는 로지스틱 회귀(Logistic Regression) 알고리즘에 기반한 기계 학습을 수행하는,다중 기계 학습 기반 악성 URL 예측 방법
|
4 |
4
제1 항에 있어서,상기 출력된 모델 각각의 예측 결과 및 상기 모델 각각의 성능 수치에 기초하여 상기 예측 대상 URL이 악성 URL인지 여부를 예측하는 단계는,상기 모델 각각의 성능 수치로서 상기 모델 각각의 정확도를 획득하는 단계;상기 모델 각각의 정확도를 이용하여 계산된 상기 모델 각각의 가중치를 상기 모델 각각의 예측 결과에 적용하여 상기 예측 대상 URL이 악성 URL인지 여부를 예측하는 단계를 포함하는,다중 기계 학습 기반 악성 URL 예측 방법
|
5 |
5
제4 항에 있어서,상기 모델 각각의 정확도를 이용하여 계산된 상기 모델 각각의 가중치를 상기 모델 각각의 예측 결과에 적용하여 상기 예측 대상 URL이 악성 URL인지 여부를 예측하는 단계는,상기 모델 각각의 가중치를 이용하여 상기 모델의 예측 결과가 악성 또는 정상인 경우 각각의 가중 평균값을 산출하는 단계; 및상기 각각의 가중 평균값에 기반하여 상기 예측 대상 URL이 악성 URL인지 여부를 결정하는 단계를 포함하는,다중 기계 학습 기반 악성 URL 예측 방법
|
6 |
6
제1 항에 있어서,상기 예측 대상 URL을 이용하여 적어도 하나의 위험 요소와 관련된 외부 데이터를 조회하는 단계;상기 각 위험 요소의 조회 결과를 이용하여 위험 점수를 산출하는 단계;상기 악성 URL인지 여부를 예측한 결과에 상기 위험 점수를 반영하여 위험도를 계산하는 단계; 및상기 위험도에 기반하여 상기 예측 대상 URL의 탐색 우선순위를 부여하는 단계를 더 포함하는,다중 기계 학습 기반 악성 URL 예측 방법
|
7 |
7
하나 이상의 프로세서;외부장치와 통신하는 통신 인터페이스;상기 프로세서에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리; 및상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되,상기 컴퓨터 프로그램은,예측 대상 URL을 복수의 모델 각각에 입력하는 동작,상기 모델 각각에 의한 예측 결과 및 상기 모델 각각의 성능 수치를 출력하는 동작, 및상기 출력된 모델 각각의 예측 결과 및 상기 모델 각각의 성능 수치에 기초하여 상기 예측 대상 URL이 악성 URL인지 여부를 예측하는 동작을 수행하기 위한 인스트럭션들(instructions)을 포함하고,상기 복수의 모델은, 수집된 URL로부터 추출된 URL 데이터, URL 콘텐츠 데이터, 및 URL 호스트 데이터를 이용하여 구성된 학습 데이터를 이용하여 서로 다른 복수의 기계 학습을 수행하여 생성된 것인, 다중 기계 학습 기반 악성 URL 예측 장치
|