1 |
1
유해 사이트 URL을 저장하는 유해 사이트 데이터베이스;상기 유해 사이트 URL이 나타내는 웹페이지를 수집하여 링크된 URL을 추출하는 웹페이지 수집 및 추출부; 및상기 링크된 URL의 웹페이지 내에서 참조하는 다른 웹페이지들이 상호 참조 관계에 따라 순환하여 상기 링크된 URL의 웹페이지로 돌아오는 연결 관계를 산출하여 유해 사이트를 판정하는 유해 사이트 연결관계 분석부를 포함하는 유해 사이트 수집 장치
|
2 |
2
제 1 항에 있어서,상기 웹페이지 수집 및 추출부에서 추출한 링크된 URL을 하위 페이지 URL과, 다른 페이지 URL로 분리하고, 상기 다른 페이지 URL의 하위 디렉토리를 제거한 대표 URL을 추출하는 URL 처리부를 더 포함하고, 상기 URL 처리부는 상기 대표 URL과 상기 유해 사이트 데이터베이스에 저장되어 있는 유해 사이트 URL을 비교하여 중복되는 대표 URL은 제거하는 유해 사이트 수집 장치
|
3 |
3
제 1 항에 있어서,상기 유해 사이트 데이터 베이스는 확정 분류된 유해 사이트의 URL과, 가분류된 유해 사이트의 URL을 저장하는 유해 사이트 수집 장치
|
4 |
4
제 3 항에 있어서,상기 유해 사이트 연결관계 분석부는 상기 가분류된 유해 사이트의 URL의 웹페이지 내에서 참조하는 다른 웹페이지들과의 연결 관계를 산출하여 유해 사이트를 판정하는 것인 유해 사이트 수집 장치
|
5 |
5
제 1 항에 있어서,상기 유해 사이트 연결관계 분석부가 상기 링크된 URL의 웹페이지 내에서 참조하는 다른 웹페이지들이 상호 참조 관계에 따라 순환하여 상기 링크된 URL의 웹페이지로 돌아오는 연결 관계를 산출하여 유해 사이트를 판정하는 것은,상기 링크된 URL의 웹페이지 내에서 참조하는 웹페이지들의 연결 관계를 나타내는 유방향 그래프를 산출하고, 상기 유방향 그래프에 포함된 웹페이지 중 적어도 하나의 웹페이지가 상기 유해 사이트 데이터베이스에 미리 저장된 유해 사이트와 동일하면 유해 사이트로 확정하는 것인 유해 사이트 수집 장치
|
6 |
6
확정 분류된 유해 사이트의 URL과, 가분류된 유해 사이트의 URL을 저장하는 유해 사이트 데이터베이스;상기 확정 분류된 유해 사이트 URL이 나타내는 웹페이지를 수집하여 링크된 URL을 추출하는 웹페이지 수집 및 추출부; 상기 확정 분류된 유해 사이트 URL이 나타내는 웹페이지에 링크된 URL을 하위 페이지 URL과, 다른 페이지 URL로 분리하고, 상기 다른 페이지 URL의 하위 디렉토리를 제거한 대표 URL을 추출하여 상기 유해 사이트 데이터 베이스의 가분류된 유해 사이트의 목록에 저장하는 URL 처리부; 및상기 가분류된 유해 사이트의 URL의 웹페이지 내에서 참조하는 다른 웹페이지들이 상호 참조 관계에 따라 순환하여 상기 링크된 URL의 웹페이지로 돌아오는 연결 관계를 산출하여 유해 사이트를 판정하는 유해 사이트 연결관계 분석부를 포함하는 유해 사이트 수집 장치
|
7 |
7
제 6 항에 있어서,상기 유해 사이트 연결관계 분석부에서 유해 사이트로 확정되지 않은 가분류된 유해 사이트들 간의 유해 사이트 랭킹을 산출하는 유해 사이트 랭크 계산부를 더 포함하고, 상기 유해 사이트 랭크 계산부는 상기 가분류된 유해 사이트를 참조하는 확정 분류된 유해 사이트의 개수에 따라 상기 유해 사이트 랭킹을 산출하는 것인 유해 사이트 수집 장치
|
8 |
8
웹페이지 수집 및 추출부가 유해 사이트의 웹페이지에 링크된 URL을 추출하는 단계; 및유해 사이트 연결관계 분석부가 상기 URL의 웹페이지에서 참조하는 적어도 하나의 웹페이지를 추출하고, 상기 URL의 웹페이지에서 참조하는 적어도 하나의 웹페이지가 상호 참조 관계에 따라 순환하여 상기 링크된 URL의 웹페이지로 돌아오는 연결 관계를 확인하고, 상기 연결 관계에 따라 상기 URL의 웹페이지가 유해 사이트에 해당하는지 여부를 판정하는 단계를 포함하는 유해 사이트 수집 방법
|
9 |
9
제 8 항에 있어서,상기 URL의 웹페이지에서 참조하는 적어도 하나의 웹페이지가 상호 참조 관계에 따라 순환하여 상기 링크된 URL의 웹페이지로 돌아오는 연결 관계를 확인하는 것은,상기 URL의 웹페이지에서 참조하는 적어도 하나의 웹페이지와의 유방향 그래프를 산출하여 연결 관계를 확인하고, 상기 유방향 그래프에 미리 정해진 확정된 유해 사이트가 포함되면, 상기 URL의 웹페이지는 유해 사이트로 확정되는 유해 사이트 수집 방법
|
10 |
10
제 8 항에 있어서,상기 URL의 웹페이지가 유해 사이트에 해당하지 않는 것으로 확인되면, 상기 URL의 웹페이지의 유해 사이트 랭크를 산출하고, 상기 URL의 웹페이지의 유해 사이트 랭크를 산출하는 것은, 상기 URL의 웹페이지를 참조로 하는 유해 사이트의 개수에 따라 상기 유해 사이트 랭크를 산출하는 것인 유해 사이트 수집 방법
|
11 |
11
제 8 항에 있어서,상기 URL의 웹페이지가 유해 사이트에 해당하는지 여부를 판정하는 단계는,기존 유해 사이트의 링크 정보에 따라 사이트들 간의 링크 관계를 수집하고, 수집된 링크에 대해 도착점이 기존의 유해사이트인 경우 시작점을 유해 사이트로 판정하는 것을 포함하는 유해 사이트 수집 방법
|