1 |
1
유해 사이트 데이터베이스부에 기 저장된 유해 사이트의 특징 분석에 따른 특징 데이터와 관련된 검색 데이터를 기반으로 검색 엔진에 의해 웹사이트를 검색하고, 상기 검색된 웹사이트로부터 웹사이트 주소와 함께, 상기 웹사이트의 콘텐츠와 관련된 객체 정보를 주기적으로 자동 획득하는 크롤링부;상기 객체 정보로부터 추출된 특징 데이터를 분석하여 산출된 유해도가 유해 임계치를 초과하는지 여부를 판단하여, 초과하면 상기 웹사이트를 유해 사이트로 판정함과 아울러서, 해당 웹사이트의 주소, 특징 데이터를 적어도 포함하는 유해 분석 정보를 생성하는 웹 콘텐츠 분석부; 및 상기 유해 분석 정보로 상기 유해 사이트 데이터베이스부를 자동 갱신하는 업데이트부를 포함하는 유해 웹사이트 정보의 업데이트 장치
|
2 |
2
제 1 항에 있어서, 상기 콘텐츠는 텍스트, 비디오 데이터 및 이미지 데이터 중 적어도 어느 하나로 구성되며, 상기 검색 데이터는 상기 기 저장된 유해 사이트의 특징 데이터를 구성하는 키워드, 이미지 및 비디오 중 적어도 어느 하나인 유해 웹사이트 정보의 업데이트 장치
|
3 |
3
제 2 항에 있어서,상기 특징 데이터는 상기 텍스트인 경우에 상기 키워드와 아울러서 상기 유해 사이트 데이터베이스부에 저장된 유해 단어를 참조하여 추출된 단어이며, 상기 비디오 데이터 또는 상기 이미지 데이터인 경우에 유해 형상으로 추정되는 특징 요소인 유해 웹사이트 정보의 업데이트 장치
|
4 |
4
제 3 항에 있어서, 상기 웹 콘텐츠 분석부는 상기 텍스트인 경우에 상기 객체 정보로부터 추출된 특징 데이터를 구성하는 상기 키워드 및 상기 추출된 단어에 기반하여 word2vec, doc2vec 또는 LDA(Latent Dirichlet Allocation) 토픽 분석 알고리즘을 이용하여 상기 유해도를 산출하는 유해 웹사이트 정보의 업데이트 장치
|
5 |
5
제 3 항에 있어서,상기 웹 콘텐츠 분석부는 상기 비디오 데이터 및 상기 이미지 데이터인 경우에 상기 객체 정보로부터 추출된 상기 특징 데이터의 상기 특징 요소에 대한 머신 러닝 또는 딥 러닝을 이용하여 상기 유해도를 산출하는 유해 웹사이트 정보의 업데이트 장치
|
6 |
6
제 1 항에 있어서, 상기 크롤링부는 상기 객체 정보와 관련된 메타 데이터를 포함하는 객체 수집 정보를 획득하여 상기 웹사이트 별로 상기 객체 수집 정보를 분류하는 것을 더 포함하는 유해 웹사이트 정보의 업데이트 장치
|
7 |
7
제 6 항에 있어서,상기 콘텐츠가 텍스트인 경우에, 상기 유해 분석 정보는 상기 객제 수집 정보, 토픽, 텍스트의 단어들 간의 컨텍스트(context) 결과값 중 적어도 어느 하나를 더 포함하며, 상기 콘텐츠가 비디오 데이터 또는 이미지 데이터인 경우에, 상기 유해 분석 정보는 상기 객체 수집 정보, 토픽, 상기 객체 정보를 구성하는 데이터에서 하나 이상을 더 포함하는 유해 웹사이트 정보의 업데이트 장치
|
8 |
8
제 3 항에 있어서,상기 특징 데이터와 관련되어 추출된 키워드, 단어 및 유해 형상으로 추정되는 특징 요소는 상기 웹 콘텐츠 분석부 및 상기 유해 사이트 데이터베이스부 중 적어도 어느 하나에서 관리되는 유해 웹사이트 정보의 업데이트 장치
|
9 |
9
제 1 항에 있어서, 상기 웹 콘텐츠 분석부는 유해성 검출 접속부를 통해 외부 모듈로 구성된 유해 미디어 외부 검출기와 연결되며, 상기 유해 미디어 외부 검출기가 상기 객체 정보로부터 추출된 특징 데이터를 분석하여 산출된 유해도가 유해 임계치를 초과하는지 여부를 판단하고, 판단 결과를 상기 웹 콘텐츠 분석부로 통지하는 유해 웹사이트 정보의 업데이트 장치
|
10 |
10
제 1 항에 있어서, 상기 업데이트부는 상기 유해 사이트로 판정된 웹사이트의 주소 및 상기 검색 데이터를 포함하는 유해 분석 정보를, 온톨로지(ontology)를 이용하는 데이터로 표현하여 상기 유해 사이트 데이터베이스부에 저장시키는 유해 웹사이트 정보의 업데이트 장치
|
11 |
11
제 1 항에 있어서, 상기 업데이트부는 상기 유해 사이트로 판정된 웹사이트의 상기 객체 정보 및 상기 유해 분석 정보가 상기 유해 사이트 데이터베이스부에 기 저장된 정보와 상이한 경우에 상기 유해 분석 정보로 갱신하는 유해 웹사이트 정보의 업데이트 장치
|
12 |
12
유해 사이트 데이터베이스부에 기 저장된 유해 사이트의 특징 분석에 따른 특징 데이터와 관련된 검색 데이터를 기반으로 검색 엔진에 의해 웹사이트를 검색하고, 상기 검색된 웹사이트로부터 웹사이트 주소와 함께, 상기 웹사이트의 콘텐츠와 관련된 객체 정보를 주기적으로 자동 획득하는 크롤링 단계;상기 객체 정보로부터 추출된 특징 데이터를 분석하여 산출된 유해도가 유해 임계치를 초과하는지 여부를 판단하여, 초과하면 상기 웹사이트를 유해 사이트로 판정함과 아울러서, 해당 웹사이트의 주소, 특징 데이터를 적어도 포함하는 유해 분석 정보를 생성하는 웹 콘텐츠 분석 단계; 및 상기 유해 분석 정보로 상기 유해 사이트 데이터베이스부를 자동 갱신하는 업데이트 단계를 포함하는 유해 웹사이트 정보의 업데이트 방법
|
13 |
13
제 12 항에 있어서,상기 콘텐츠는 텍스트, 비디오 데이터 및 이미지 데이터 중 적어도 어느 하나로 구성되며, 상기 검색 데이터는 상기 기 저장된 유해 사이트의 특징 데이터를 구성하는 키워드, 이미지 및 비디오 중 적어도 어느 하나인 유해 웹사이트 정보의 업데이트 방법
|
14 |
14
제 13 항에 있어서,상기 특징 데이터는 상기 텍스트인 경우에 상기 키워드와 아울러서 상기 유해 사이트 데이터베이스부에 저장된 유해 단어를 참조하여 추출된 단어이며, 상기 비디오 데이터 또는 상기 이미지 데이터인 경우에 유해 형상으로 추정되는 특징 요소인 유해 웹사이트 정보의 업데이트 방법
|
15 |
15
제 14 항에 있어서,상기 웹 콘텐츠 분석 단계는 상기 텍스트인 경우에 상기 객체 정보로부터 추출된 특징 데이터를 구성하는 상기 키워드 및 상기 추출된 단어에 기반하여 word2vec, doc2vec 또는 LDA(Latent Dirichlet Allocation) 토픽 분석 알고리즘을 이용하여 상기 유해도를 산출하고, 상기 비디오 데이터 및 상기 이미지 데이터인 경우에 상기 객체 정보로부터 추출된 상기 특징 데이터의 상기 특징 요소에 대한 머신 러닝 또는 딥 러닝을 이용하여 상기 유해도를 산출하는 유해 웹사이트 정보의 업데이트 방법
|
16 |
16
제 12 항에 있어서,상기 크롤링 단계는 상기 객체 정보와 관련된 메타 데이터를 포함하는 객체 수집 정보를 획득하여 상기 웹사이트 별로 상기 객체 수집 정보를 분류하는 것을 더 포함하는 유해 웹사이트 정보의 업데이트 방법
|
17 |
17
제 16 항에 있어서,상기 콘텐츠 타입이 텍스트인 경우에, 상기 유해 분석 정보는 상기 객제 수집 정보, 토픽, 텍스트의 단어들 간의 컨텍스트(context) 결과값 중 적어도 어느 하나를 더 포함하며, 상기 콘텐츠 타입이 비디오 데이터 또는 이미지 데이터인 경우에, 상기 유해 분석 정보는 상기 객체 수집 정보, 토픽, 상기 객체 정보를 구성하는 데이터에서 하나 이상을 더 포함하는 유해 웹사이트 정보의 업데이트 방법
|
18 |
18
제 12 항에 있어서,상기 웹 콘텐츠 분석 단계는, 외부 모듈로 구성되는 유해 미디어 외부 검출기에 의해, 상기 객체 정보로부터 추출된 특징 데이터를 분석하여 산출된 유해도가 유해 임계치를 초과하는지 여부를 판단하는 유해 웹사이트 정보의 업데이트 방법
|
19 |
19
제 12 항에 있어서,상기 업데이트 단계는 상기 유해 사이트로 판정된 웹사이트의 주소 및 상기 검색 데이터를 포함하는 유해 분석 정보를, 온톨로지(ontology)를 이용하는 데이터로 표현하여 상기 유해 사이트 데이터베이스부에 저장시키는 유해 웹사이트 정보의 업데이트 방법
|
20 |
20
제 12 항에 있어서, 상기 업데이트 단계는 상기 유해 사이트로 판정된 웹사이트의 상기 객체 정보 및 상기 유해 분석 정보가 상기 유해 사이트 데이터베이스부에 기 저장된 정보와 상이한 경우에 상기 유해 분석 정보로 갱신하는 유해 웹사이트 정보의 업데이트 방법
|