1 |
1
문서영상 영역해석 시스템에 적용되는 문서영상의 영역 해석 방법에 있어서, 문서영상을 축소시켜 축소된 영상에서 연결요소를 추출하고, 추출된 연결요소들의 기학학적인 특징을 분석하여 연결요소의 유형을 정의하는 제 1 단계; 상기 연결요소의 유형을 토대로 트리를 생성하여 연결요소를 문자영역, 비문자영역으로 분류하는 제 2 단계; 상기 분류된 연결요소에서 문자 요소들을 공간적인 관계에 따라 그룹화하는 제 3 단계; 및 그룹화된 상기 연결요소의 반복적인 분리와 병합을 통하여 문자 블록을 재구성하는 제 4 단계 를 포함하는 문서영상 영역해석 방법
|
2 |
2
제 1 항에 있어서, 상기 연결요소의 분석 과정은, 문서영상에서 rc
|
3 |
3
제 1 항에 있어서, 상기 연결요소의 분류 과정에서, 단일 라인, 다중 부모라인 및 다중 형제라인 형태로 추출되는 것을 특징으로 하는 것을 특징으로 하는 문서영상 영역해석 방법
|
4 |
4
제 1 항에 있어서, 상기 제 2 단계는, 상기 연결요소의 유형들로부터 트리를 구성하는 제 5 단계; 상기 구성된 트리에서 테이블, 프레임, 그림을 포함하는 연결요소들을 요소들에 속한 문서와 함께 독립된 노드로 그룹화하는 제 6 단계; 여백에 의해 둘러 쌓인 문자 블록내의 연결요소들을 그룹화하는 제 7 단계; 및 상기 그룹화되지 않은 노드들을 연결요소의 영역에 의해 분류하는 제 8 단계 를 포함하는 것을 특징으로 하는 문서영상 영역해석 방법
|
5 |
5
제 1 항에 있어서, 상기 문자 요소의 그룹화 과정은, 동일한 부모노드를 갖는 문자 요소상에서 수행되며, 수평/수직으로 정렬된 문자와 일정하지 않게 떨어져 있는 문자는 전체 문서 대신에 각 내부 노드에 대하여 인접한 단어나 인접한 문자내의 줄 사이의 공간과 문자 크기를 계산하여 수행하는 것을 특징으로 하는 문서영상 영역해석 방법
|
6 |
6
제 3 항에 있어서, 상기 제 8 단계에서 노드들은, 긴 높이와 좁은 영역을 갖는 연결요소는 수직바로, 긴 높이와 넓은 영역을 갖는 연결요소는 수직으로 놓여 있는 그림 및 연결요소의 넓이와 길이가 가장 큰 글자보다 크면 비문자영역으로 분류되는 것을 특징으로 하는 문서영상 영역해석 방법
|
7 |
7
문서영상을 해석하기 위하여, 프로세서를 구비한 문서영상 영역해석 시스템에, 문서영상을 축소시켜 축소된 영상에서 연결요소를 추출하고, 추출된 연결요소들의 기학학적인 특징을 분석하여 연결요소의 유형을 정의하는 제 1 기능; 상기 연결요소의 유형을 토대로 트리를 생성하여 연결요소를 문자영역, 비문자영역으로 분류하는 제 2 기능; 상기 분류된 연결요소에서 문자 요소들을 공간적인 관계에 따라 그룹화하는 제 3 기능; 및 그룹화된 상기 연결요소의 반복적인 분리와 병합을 통하여 문자 블록을 재구성하는 제 4 기능 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
|