1 |
1
웹 페이지를 적어도 하나의 블럭으로 분할하는 분할부;상기 블럭에 포함된 단어의 품사와 상기 품사의 빈도수에 관한 품사 데이터를 추출하는 추출부; 그리고상기 품사 데이터를 기반으로 상기 블럭을 분류하되, 상기 품사 데이터를 블럭의 타입(type)마다 설정된 기준 품사 데이터와 비교하여, 상기 품사 데이터가 상기 기준 품사 데이터와 매칭되는 경우, 해당 블럭을 상기 매칭된 기준 품사 데이터에 대응되는 블럭으로 분류하는 분류부;를 포함하는 웹 페이지 분석 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
제 1 항에 있어서,상기 추출부는: 상기 블럭에 포함된 단어의 품사를 결정하고, 상기 블럭에 포함된 단어의 개수에 대한 품사의 빈도수의 비를 산출하는 품사 분포 산출부를 포함하는 웹 페이지 분석 장치
|
5 |
5
제 4 항에 있어서,상기 품사 분포 산출부는 상기 단어의 품사를 보통명사, 고유명사, 대명사, 전치사, 접속사, 동사, 수사, 부사, 형용사, 조사, 관형사 및 감탄사 중 어느 하나로 결정하는 웹 페이지 분석 장치
|
6 |
6
제 1 항에 있어서,상기 웹 페이지는 인물을 소개하는 홈페이지를 포함하는 웹 페이지 분석 장치
|
7 |
7
제 6 항에 있어서,상기 분류부는 상기 블럭을:인물의 소속 및 직위 중 적어도 하나에 대한 정보를 포함하는 기본 블럭;인물의 연락처에 대한 정보를 포함하는 연락처 블럭;인물의 사진 이미지를 포함하는 사진 블럭;인물이 집필한 글에 대한 정보를 포함하는 글 블럭; 그리고상기 인물의 소속 또는 직위에 대한 정보, 상기 인물의 연락처에 대한 정보, 상기 인물의 사진 이미지, 및 상기 인물이 집필한 글에 대한 정보 중 둘 이상을 포함하는 혼합 블럭;중 어느 하나로 분류하는 웹 페이지 분석 장치
|
8 |
8
제 7 항에 있어서,상기 분류부는, 상기 블럭이 상기 기본 블럭, 상기 연락처 블럭, 상기 사진 블럭, 상기 글 블럭 및 상기 혼합 블럭 중 어느 블럭에도 해당되지 않으면, 상기 블럭을 비정보 블럭으로 분류하는 웹 페이지 분석 장치
|
9 |
9
제 7 항에 있어서,상기 분류부는, 상기 블럭의 품사 데이터를, 상기 기본 블럭, 상기 연락처 블럭, 상기 사진 블럭, 상기 글 블럭 및 상기 혼합 블럭마다 설정된 기준 품사 데이터와 비교하여, 상기 품사 데이터가 상기 기준 품사 데이터와 매칭되는 경우, 상기 블럭을 상기 매칭된 기준 품사 데이터에 대응되는 블럭으로 분류하는 웹 페이지 분석 장치
|
10 |
10
삭제
|
11 |
11
웹 페이지를 적어도 하나의 블럭으로 분할하는 단계;상기 블럭에 포함된 단어의 품사와 상기 품사의 빈도수에 관한 품사 데이터를 추출하는 단계; 그리고상기 품사 데이터를 기반으로 상기 블럭을 분류하는 단계를 포함하되,상기 블럭을 분류하는 단계는:상기 블럭의 품사 데이터를 블럭의 타입(type)마다 설정된 기준 품사 데이터와 비교하는 단계;상기 품사 데이터와 매칭되는 기준 품사 데이터를 검출하는 단계; 그리고해당 블럭을 상기 매칭된 기준 품사 데이터에 대응되는 블럭으로 분류하는 단계;를 포함하는 웹 페이지 분석 방법
|
12 |
12
삭제
|
13 |
13
제 11 항에 있어서,상기 품사 데이터를 추출하는 단계는:상기 블럭에 포함된 단어의 품사를 결정하는 단계; 그리고상기 블럭에 포함된 단어의 개수에 대한 품사의 빈도수의 비를 산출하는 단계;를 포함하는 웹 페이지 분석 방법
|
14 |
14
제 11 항에 있어서,상기 웹 페이지는 인물을 소개하는 홈페이지를 포함하는 웹 페이지 분석 방법
|
15 |
15
제 14 항에 있어서,상기 블럭을 분류하는 단계는:(i) 상기 블럭을, 인물의 소속 또는 직위에 대한 정보를 포함하는 기본 블럭; 인물의 연락처에 대한 정보를 포함하는 연락처 블럭; 인물의 사진 이미지를 포함하는 사진 블럭; 인물이 집필한 글에 대한 정보를 포함하는 글 블럭; 그리고 상기 인물의 소속 또는 직위에 대한 정보, 상기 인물의 연락처에 대한 정보, 상기 인물의 사진 이미지, 및 상기 인물이 집필한 글에 대한 정보 중 둘 이상을 포함하는 혼합 블럭 중 어느 하나로 분류하는 단계; 그리고(ii) 상기 블럭이 상기 기본 블럭, 상기 연락처 블럭, 상기 사진 블럭, 상기 글 블럭 및 상기 혼합 블럭 중 어느 블럭에도 해당되지 않으면, 상기 블럭을 비정보 블럭으로 분류하는 단계;를 포함하는 웹 페이지 분석 방법
|
16 |
16
제 15 항에 있어서,상기 단계 (i)는:상기 블럭의 단어 데이터 또는 품사 데이터를, 상기 기본 블럭, 상기 연락처 블럭, 상기 사진 블럭, 상기 글 블럭 및 상기 혼합 블럭마다 설정된 기준 단어 데이터 또는 기준 품사 데이터와 비교하는 단계;상기 단어 데이터 또는 상기 품사 데이터와 매칭되는 기준 단어 데이터 또는 기준 품사 데이터를 검출하는 단계; 그리고상기 블럭을 상기 매칭된 기준 단어 데이터 또는 기준 품사 데이터에 대응되는 블럭으로 분류하는 단계;를 포함하는 웹 페이지 분석 방법
|
17 |
17
인물을 소개하는 웹 페이지를 수신하는 수신부;상기 웹 페이지를 블럭으로 분할하고, 상기 블럭을 분류하도록 상기 웹 페이지를 분석하는 웹 페이지 분석부;상기 웹 페이지를 구성하는 블럭의 타입(type)에 대한 정보를 제공하는 정보 제공부; 그리고상기 블럭의 타입에 대한 정보 및 상기 블럭의 컨텐츠를 기반으로 상기 인물의 프로필을 작성하는 프로필 작성부;를 포함하며, 상기 웹 페이지 분석부는: 상기 웹 페이지를 적어도 하나의 블럭으로 분할하는 분할부; 상기 블럭에 포함된 단어와 상기 단어의 빈도수에 관한 단어 데이터, 및 상기 블럭에 포함된 단어의 품사와 상기 품사의 빈도수에 관한 품사 데이터 중 적어도 하나를 추출하는 추출부; 그리고 상기 단어 데이터 및 상기 품사 데이터 중 적어도 하나를 기반으로 상기 블럭을 분류하되, 상기 단어 데이터를 블럭의 타입마다 설정된 기준 단어 데이터와 비교하거나 상기 품사 데이터를 블럭의 타입마다 설정된 기준 품사 데이터와 비교하여, 상기 단어 데이터가 상기 기준 단어 데이터와 매칭되거나 상기 품사 데이터가 상기 기준 품사 데이터와 매칭되는 경우, 해당 블럭을 상기 매칭된 기준 단어 데이터 또는 기준 품사 데이터에 대응되는 블럭으로 분류하는 분류부;를 포함하는 인물 프로필 작성 장치
|
18 |
18
제 17 항에 있어서,상기 수신부는 상기 웹 페이지의 HTML 코드 또는 XML 코드를 수신하는 인물 프로필 작성 장치
|
19 |
19
제 17 항에 있어서,상기 수신부는 상기 웹 페이지의 URL 주소를 수신하고, 상기 URL 주소에 액세스하여 상기 웹 페이지의 HTML 코드 또는 XML 코드를 수신하는 인물 프로필 작성 장치
|
20 |
20
컴퓨터로 읽을 수 있는 기록매체에 있어서,웹 페이지를 적어도 하나의 블럭으로 분할하는 단계;상기 블럭에 포함된 단어의 품사와 상기 품사의 빈도수에 관한 품사 데이터를 추출하는 단계; 그리고상기 품사 데이터를 기반으로 상기 블럭을 분류하는 단계를 포함하되,상기 블럭을 분류하는 단계가:상기 블럭의 품사 데이터를 블럭의 타입(type)마다 설정된 기준 품사 데이터와 비교하는 단계;상기 품사 데이터와 매칭되는 기준 품사 데이터를 검출하는 단계; 그리고해당 블럭을 상기 매칭된 기준 품사 데이터에 대응되는 블럭으로 분류하는 단계;를 포함하는 웹 페이지 분석 프로세스를 실행하는 프로그램이 기록된 기록매체
|