1 |
1
웹 페이지 크롤링 방법에 있어서,루트 웹 주소 리스트를 획득하는 과정;상기 루트 웹 주소에 링크된 웹 주소 리스트를 획득하는 과정;상기 웹 주소 리스트에 기반한 각 웹 주소의 페이지에 대한 콘텐츠를 평가하는 과정;상기 웹 주소의 페이지에 대한 콘텐츠 평가에 따라 크롤링 깊이를 조절하는 과정;상기 조절된 크롤링 깊이에 따라 웹 페이지들을 크롤링 하는 과정을 포함하는 웹 페이지 크롤링 방법
|
2 |
2
제1항에 있어서, 상기 크롤링된 웹 페이지의 웹 주소를 상기 루트 웹 주소 리스트에 포함하는 과정을 더 포함하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
3 |
3
제1항에 있어서, 상기 크롤링된 웹 페이지들을 사용자에 의해 요청된 특정 정보에 근접한 우선 순위대로 단말기에 제공하는 과정을 더 포함하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
4 |
4
제1항에 있어서, 상기 크롤링된 웹 페이지들을 사용자에 의해 요청된 특정 정보에 근접한 우선 순위대로 단말기에 제공하는 과정을 더 포함하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
5 |
5
제1항에 있어서, 상기 크롤링된 웹 페이지 및 웹 주소 정보를 특정 정보에 기반하여 카테고리별로 분류하여 단말기에 제공하는 과정을 도 포함하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
6 |
6
제1항에 있어서, 상기 웹 주소 리스트 획득 과정은 최대 크롤링 깊이에 기반하여 방문할 웹 주소 리스트를 획득하는 과정; 및획득된 웹 주소 리스트를 데이터 베이스 포맷으로 변화하고 저장하는 과정을 구비하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
7 |
7
제1항에 있어서, 상기 웹 주소의 페이지에 대한 콘텐츠 평가 과정은,저장된 웹 주소 리스트를 기반으로 현재 방문할 웹 주소 리스트 획득 및 현재 크롤링 깊이 정보를 저장하는 과정;상기 획득된 웹 주소 리스트에 포함된 웹 주소를 방문하여 해당 웹 주소의 페이지에 대한 콘텐츠를 획득하는 과정;상기 획득된 웹 주소의 페이지의 콘텐츠에 특정 정보의 존재 여부를 평가하는 과정을 구비하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
8 |
8
제1항에 있어서, 상기 크롤링 깊이 조절 과정은상기 웹 주소의 페이지에 대한 콘텐츠의 평가에 따라 해당 웹 주소의 페이지를 필터링하는 과정;상기 웹 주소 페이지의 필터링 과정을 통해 특정 정보를 포함한 웹 페이지를 획득하는 속도값을 평가하는 과정;상기 획득된 웹 페이지의 콘텐츠를 파싱하여 콘텐츠와 웹 주소 정보를 저장하고 업데이트하는 과정;상기 특정 정보를 포함한 웹 페이지를 획득하는 속도값에 기반하여 크롤링 깊이를 조절하는 과정을 포함하는 것을 특징으로 하는 웹 페이지 크롤링 방법
|
9 |
9
제8항에 있어서, 상기 웹 페이지를 획득하는 속도값은 특정 정보를 포함한 웹 주소 페이지를 찾는 속도임을 특징으로 하는 웹 페이지 크롤링 방법
|
10 |
10
제8항에 있어서, 상기 웹 페이지를 획득하는 속도값이 정해진 값이 될 때 까지 크롤링 깊이를 조절하는 것임을 특징으로 하는 웹 페이지 크롤링 방법
|
11 |
11
웹 페이지 크롤링 방법에 있어서,사용자 위치를 검출하는 과정;상기 검출된 사용자 위치 정보에 기반한 크롤링할 루트 웹 주소 리스트를 획득하는 과정;상기 획득된 루트 웹 주소에 매핑된 웹 주소 리스트를 획득하는 과정;상기 웹 주소 리스트에 기반하여 웹 주소 페이지의 콘텐츠를 평가하는 과정;상기 평가된 웹 주소의 페이지에 대한 콘텐츠 평가에 따라 크롤링 깊이를 조절하는 과정;상기 조절된 크롤링 깊이에 따라 웹 페이지를 크롤링하는 과정을 포함하는 웹 페이지 크롤링 방법
|
12 |
12
웹 페이지 크롤링 장치에 있어서,인터넷 또는 단말기를 통해 루트 웹 주소 리스트 및 그 루트 웹 주소에 링크된 웹 주소 리스트를 획득하는 웹 주소 획득부;상기 웹 주소 획득부에서 획득된 웹 주소 리스트들을 기반으로 해당 웹 주소들을 방문하여 각 웹 주소 페이지에 대한 콘텐츠를 획득하고, 그 콘텐츠내에 특정 정보가 존재하는가를 평가하는 웹 페이지 평가부;상기 웹 페이지 평가부에서 평가된 결과에 따라 크롤링 깊이를 조절하는 크롤링 깊이 조절부;상기 크롤링 깊이 조절부에서 조절된 크롤링 깊이에 따라 웹 페이지들을 크롤링하는 크롤링부를 포함하는 웹 페이지 크롤링 장치
|
13 |
13
제12항에 있어서, 상기 웹 페이지 평가부는 특정 정보를 갖는 웹 페이지를 필터링하는 것임을 특징으로 웹 페이지 크롤링 장치
|
14 |
14
제12항에 있어서, 상기 웹 주소 획득부에서 획득된 웹 주소 리스트를 저장하고, 크롤링부에서 크롤링된 웹 페이지의 콘텐츠와 웹 주소 정보를 저장하는 크롤링 데이터베이스를 더 포함하는 것을 특징으로 하는 웹 페이지 크롤링 장치
|
15 |
15
제12항에 있어서, 상기 크롤링부에서 크롤링된 웹 페이지를 우선 순위 또는 설정된 기준으로 사용자에게 제공하는 웹 제공부를 더 포함하는 것을 특징으로 하는 웹 페이지 크롤링 장치
|
16 |
16
제 1항 내지 제 11항 중 어느 한 항의 방법을 구현하기 위한 프로그램이 기록된 컴퓨터로 읽을 수 있는 기록 매체
|