1 |
1
컴퓨팅 장치에 의해 수행되는 XAI(eXplainable Artifical Intelligence) 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법에 있어서,적어도 하나 이상의 유해 사이트로부터 추출된 키워드와, 적어도 하나 이상의 정상 사이트로부터 추출된 키워드를 이용하여 학습 데이터를 구축하는 단계;상기 구축된 학습 데이터를 이용하여 유해 사이트 분류 모델을 생성하는 단계;상기 유해 사이트 분류 모델에 대하여 XAI 기반 분석을 적용하여 추출된 키워드 별 상기 유해 사이트 분류 모델에 대한 기여도를 산출하는 단계; 및상기 기여도에 기초하여 상기 추출된 키워드 가운데 유효 키워드를 탐색하는 단계를 포함하는, XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법
|
2 |
2
제 1 항에 있어서,상기 적어도 하나 이상의 유해 사이트로부터 추출된 키워드는,적어도 하나 이상의 유해 사이트로부터 일정 기간에 걸쳐 주기적으로 추출된 키워드의 그룹을 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법
|
3 |
3
제 2항에 있어서, 상기 기여도에 기초하여 상기 추출된 키워드 가운데 유효 키워드를 탐색하는 단계는,상기 일정 기간에 걸쳐 주기적으로 추출된 키워드의 그룹에 대해 산출된 기여도가 미리 정한 수치 이상인 경우 유효 키워드로 판단하는 단계를 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법
|
4 |
4
제 1항에 있어서,상기 유해 사이트 분류 모델에 대하여 XAI 기반 분석을 적용하여 추출된 키워드 별 상기 유해 사이트 분류 모델에 대한 기여도를 산출하는 단계는,상기 유해 사이트 분류 모델에 대하여 SHAP(Shapley Additive exPlanations) 기법을 적용하여 추출된 키워드의 조합에 대한 속성의 평균 예상 기여도를 산출하는 단계를 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법
|
5 |
5
제 1항에 있어서,적어도 하나 이상의 유해 사이트로부터 추출된 키워드와, 적어도 하나 이상의 정상 사이트로부터 추출된 키워드를 이용하여 학습 데이터를 구축하는 단계는,상기 적어도 하나 이상의 유해 사이트와 정상 사이트로부터 HTML 데이터와 이미지 데이터를 수집하는 단계;상기 HTML 데이터 가운데 태그(Tag) 내의 텍스트를 추출하고, 상기 이미지 데이터를 OCR(Optical Character Recognition) 적용하여 텍스트를 추출하는 단계; 및추출된 텍스트로부터 형태소 분석을 이용한 필터링으로 키워드를 추출하여 학습 데이터를 구축하는 단계를 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 방법
|
6 |
6
컴퓨터를 이용하여 제 1항 내지 제 5항의 방법 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 상기 컴퓨터로 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
|
7 |
7
컴퓨팅 장치에 의해 수행되는 XAI(eXplainable Artifical Intelligence) 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템에 있어서,적어도 하나 이상의 유해 사이트 및 정상 사이트로부터 키워드를 추출하여 저장하는 키워드 추출부;상기 적어도 하나 이상의 유해 사이트 및 정상 사이트로부터 추출된 키워드를 이용하여 학습 데이터를 구축하는 학습 데이터 구축부;상기 구축된 학습 데이터를 이용하여 유해 사이트 분류 모델을 생성하는 모델 생성부;상기 유해 사이트 분류 모델에 대하여 XAI 기반 분석을 적용하여 추출된 키워드 별 상기 유해 사이트 분류 모델에 대한 기여도를 산출하는 XAI 연산부; 및상기 기여도에 기초하여 상기 추출된 키워드 가운데 유효 키워드를 탐색하는 키워드 탐색부를 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템
|
8 |
8
제 7항에 있어서,상기 적어도 하나 이상의 유해 사이트로부터 추출된 키워드는,적어도 하나 이상의 유해 사이트로부터 일정 기간에 걸쳐 주기적으로 추출된 키워드의 그룹을 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템
|
9 |
9
제 8항에 있어서,상기 키워드 탐색부는상기 일정 기간에 걸쳐 주기적으로 추출된 키워드의 그룹에 대해 산출된 기여도가 미리 정한 수치 이상인 경우 유효 키워드로 판단하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템
|
10 |
10
제 7항에 있어서,상기 XAI 연산부는,상기 유해 사이트 분류 모델에 대하여 SHAP(Shapley Additive exPlanations) 기법을 적용하여 추출된 키워드의 조합에 대한 속성의 평균 예상 기여도를 산출하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템
|
11 |
11
제 7항에 있어서,상기 키워드 추출부는,상기 적어도 하나 이상의 유해 사이트와 정상 사이트로부터 HTML 데이터와 이미지 데이터를 수집하는 크롤링부;상기 HTML 데이터 가운데 태그(Tag) 내의 텍스트를 추출하고, 상기 이미지 데이터를 OCR(Optical Character Recognition) 적용하여 텍스트를 추출하는 텍스트 추출부, 및상기 학습 데이터 추출부는, 추출된 텍스트로부터 형태소 분석을 이용한 필터링으로 키워드를 추출하는 전처리부를 포함하는,XAI 기반 유해 사이트 분류 모델 분석을 통한 키워드 탐색 시스템
|