1 |
1
문서 영역 분할 방법에 있어서,문서 영상에 포함되는 연결 요소들을 군집화(clustering)하여 텍스트 라인 후보들을 검출하는 단계;상기 검출된 텍스트 라인 후보들에 대해서, 서로 다른 두 개의 문턱값을 이용한 필터링을 수행함으로써, 비텍스트 요소를 제거하고 텍스트 라인을 검출하는 단계;상기 검출된 텍스트 라인을 상기 문서 영상에서 제거한 후, 반복 X-Y 컷(cut)을 수행함으로써 비텍스트 영역을 검출하는 단계; 및상기 검출된 비텍스트 영역을 관심 영역과 비교함으로써 문서 경계를 검출하는 단계를 포함하는 방법
|
2 |
2
제1항에 있어서,상기 텍스트 라인 후보들을 검출하는 단계는,상기 문서 영상에 이진화 알고리즘 또는 MSER(Maximally Stable External Region) 알고리즘을 적용하여 연결 요소들을 추출하는 단계;상기 추출된 연결 요소들을 군집화하는 단계; 및상기 연결 요소의 각 군집(cluster)에 대해서, 가로 방향 및 세로 방향 중 적어도 하나의 방향으로 투사(projection)함으로써, 상기 텍스트 라인 후보들을 검출하는 단계를 포함하는 것을 특징으로 하는 방법
|
3 |
3
제2항에 있어서,상기 연결 요소들을 추출하는 단계는,상기 문서 영상에 상기 이진화 알고리즘 또는 MSER 알고리즘을 적용하여 추출된 연결 요소들에 대해서, 고유값 및 픽셀 개수에 기초하여 필터링을 수행함으로써 비텍스트 요소를 제거한 후, 남은 연결 요소들만을 추출하는 것을 특징으로 하는 방법
|
4 |
4
제2항에 있어서,상기 텍스트 라인 후보들을 검출하는 단계는,상기 군집에 포함된 연결 요소 사이의 여백의 너비와 상기 연결 요소의 평균 획 굵기를 비교한 결과에 따라 상기 군집을 복수의 세부 군집들로 나누고, 상기 세부 군집들을 텍스트 라인 후보들로 검출하는 것을 특징으로 하는 방법
|
5 |
5
제1항에 있어서,상기 텍스트 라인을 검출하는 단계는,상기 텍스트 라인 후보들에 대해서, 제1 문턱값을 이용한 필터링을 수행하여 비텍스트 요소를 제거하고, 남은 텍스트 라인 후보들을 문단으로 군집화하는 단계; 및상기 남은 텍스트 라인 후보들 중 문단으로 군집화되지 않은 텍스트 라인 후보들에 대해서, 상기 제1 문턱값보다 큰 제2 문턱값을 이용한 필터링을 수행하여 비텍스트 요소를 제거하고, 남은 텍스트 라인 후보들을 텍스트 라인으로 검출하는 단계를 포함하는 것을 특징으로 하는 방법
|
6 |
6
제1항에 있어서,상기 비텍스트 영역을 검출하는 단계는,상기 문서 영상에서 검출된 텍스트 라인을 제거하는 단계;상기 검출된 텍스트 라인에 기초하여, 상기 관심 영역을 조절하는 단계;상기 관심 영역의 경계에 걸쳐서 존재하는 연결 요소들이 배경에 해당되는지를 판단하는 단계;배경으로 판단된 연결 요소를 제거하는 단계; 및남은 연결 요소들에 대해서 반복 X-Y 컷을 수행하는 단계를 포함하는 것을 특징으로 하는 방법
|
7 |
7
제1항에 있어서,상기 문서 경계를 검출하는 단계는,상기 비텍스트 영역이 상기 관심 영역의 외부에도 존재한다면, 상기 관심 영역의 내부에 상기 비텍스트 영역이 포함되도록 상기 관심 영역을 확장하는 단계; 및상기 확장된 관심 영역의 경계를 문서 경계로 결정하는 단계를 포함하는 것을 특징으로 하는 방법
|
8 |
8
제1항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
|
9 |
9
문서 영역 분할 장치에 의해 수행되며, 제1항에 기재된 방법을 수행하기 위해 매체에 저장된 컴퓨터 프로그램
|
10 |
10
문서 영역 분할 장치에 있어서,문서 영상의 처리와 관련된 입력을 수신하고, 문서 영상의 처리가 진행되는 상황 및 결과를 보여주기 위한 입출력부;문서 영역 분할을 수행하기 위한 프로그램이 저장되는 저장부; 및상기 프로그램을 실행함으로써 상기 문서 영상의 영역 분할을 수행하는 제어부를 포함하며,상기 제어부는, 상기 문서 영상에 포함되는 연결 요소들을 군집화(clustering)하여 텍스트 라인 후보들을 검출하고, 상기 검출된 텍스트 라인 후보들에 대해서, 서로 다른 두 개의 문턱값을 이용한 필터링을 수행함으로써, 비텍스트 요소를 제거하고 텍스트 라인을 검출하며, 상기 검출된 텍스트 라인을 상기 문서 영상에서 제거한 후, 반복 X-Y 컷(cut)을 수행함으로써 비텍스트 영역을 검출하고, 상기 검출된 비텍스트 영역을 관심 영역과 비교함으로써 문서 경계를 검출하는, 장치
|
11 |
11
제10항에 있어서,상기 제어부는,상기 문서 영상에 이진화 알고리즘 또는 MSER(Maximally Stable External Region) 알고리즘을 적용하여 연결 요소들을 추출하고, 상기 추출된 연결 요소들을 군집화하고, 상기 연결 요소의 각 군집(cluster)에 대해서 가로 방향 및 세로 방향 중 적어도 하나의 방향으로 투사(projection)함으로써, 상기 텍스트 라인 후보들을 검출하는 것을 특징으로 하는 장치
|
12 |
12
제11항에 있어서,상기 제어부는,상기 문서 영상에 상기 이진화 알고리즘 또는 MSER 알고리즘을 적용하여 추출된 연결 요소들에 대해서, 고유값 및 픽셀 개수에 기초하여 필터링을 수행함으로써 비텍스트 요소를 제거한 후, 남은 연결 요소들만을 추출하는 것을 특징으로 하는 장치
|
13 |
13
제11항에 있어서,상기 제어부는,상기 군집에 포함된 연결 요소 사이의 여백의 너비와 상기 연결 요소의 평균 획 굵기를 비교한 결과에 따라 상기 군집을 복수의 세부 군집들로 나누고, 상기 세부 군집들을 텍스트 라인 후보들로 검출하는 것을 특징으로 하는 장치
|
14 |
14
제10항에 있어서,상기 제어부는,상기 텍스트 라인 후보들에 대해서, 제1 문턱값을 이용한 필터링을 수행하여 비텍스트 요소를 제거하고, 남은 텍스트 라인 후보들을 문단으로 군집화하고, 상기 남은 텍스트 라인 후보들 중 문단으로 군집화되지 않은 텍스트 라인 후보들에 대해서, 상기 제1 문턱값보다 큰 제2 문턱값을 이용한 필터링을 수행하여 비텍스트 요소를 제거하고, 남은 텍스트 라인 후보들을 텍스트 라인으로 검출하는 것을 특징으로 하는 장치
|
15 |
15
제10항에 있어서,상기 제어부는,상기 문서 영상에서 검출된 텍스트 라인을 제거하고, 상기 검출된 텍스트 라인에 기초하여 상기 관심 영역을 조절하고, 상기 관심 영역의 경계에 걸쳐서 존재하는 연결 요소들이 배경에 해당되는지를 판단하고, 배경으로 판단된 연결 요소를 제거하고, 남은 연결 요소들에 대해서 반복 X-Y 컷을 수행함으로써, 상기 비텍스트 영역을 검출하는 것을 특징으로 하는 장치
|
16 |
16
제10항에 있어서,상기 제어부는,상기 비텍스트 영역이 상기 관심 영역의 외부에도 존재한다면, 상기 관심 영역의 내부에 상기 비텍스트 영역이 포함되도록 상기 관심 영역을 확장하고, 상기 확장된 관심 영역의 경계를 문서 경계로 결정하는 것을 특징으로 하는 장치
|