1 |
1
문서 구조를 분석하기 위한 방법으로서,입력된 이미지에 사전결정된 이진화(binarization) 기법을 적용함으로써 이진화된 이미지를 생성하는 단계;상기 생성된 이진화된 이미지에 연결 요소 알고리즘(connected component algorithm)을 적용함으로써 연결 요소들을 생성하는 단계;상기 생성된 연결 요소들의 기하학적 성질(geometrical property)에 기초하여 상기 연결 요소들 각각의 크기값을 특성화하는 단계;상기 연결 요소들의 특성화된 크기값에 적어도 부분적으로 기초하여 퍼지 에너지 매트릭스(FEM:Fuzzy Energy Matrix)를 생성하는 단계; 및상기 생성된 퍼지 에너지 매트릭스를 기초로 하여 상기 입력된 이미지에서의 텍스트 부분과 비-텍스트 부분을 구별하여 인식하는 단계;문서 구조를 분석하기 위한 방법
|
2 |
2
제 1 항에 있어서,상기 연결 요소들 각각의 크기값을 특성화하는 단계는,상기 생성된 연결 요소들의 높이(H)와 폭(Width)에 기초하여 상기 생성된 연결 요소들의 크기값을 특성화하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
3 |
3
제 1 항에 있어서,상기 퍼지 에너지 매트릭스(FEM)를 생성하는 단계는,상기 연결 요소들 각각의 특성화된 크기값(F)과 상기 이미지의 사전결정된 위치값(Mh)에 대한 소속 정도(grade of membership)를 결정하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
4 |
4
제 1 항에 있어서,상기 퍼지 에너지 매트릭스(FEM)를 생성하는 단계는,퍼지화 프로세스(fuzzification process)를 통하여, 높이 위치 벡터(Mh) 및 특성화된 크기값(F)에 대한 입력값에 적어도 부분적으로 기초하여 퍼지화된 벡터들(Fv1 및 Fv2)을 생성하는 단계;더 포함하는,문서 구조를 분석하기 위한 방법
|
5 |
5
제 4 항에 있어서,상기 퍼지 에너지 매트릭스(FEM)를 생성하는 단계는,퍼지 에너지 매트릭스(FEM) 생성 프로세스를 통하여, 상기 퍼지화된 벡터들(Fv1 및 Fv2)에 대한 입력값에 적어도 부분적으로 기초하여 퍼지 에너지 매트릭스(FEM)를 생성하는 단계;를 더 포함하는,문서 구조를 분석하기 위한 방법
|
6 |
6
제 1 항에 있어서,상기 퍼지 에너지 매트릭스(FEM)를 생성하는 단계는,상기 이미지 내의 사전결정된 위치의 값(Mh), 및 상기 위치 각각에 존재하는 특성화된 크기값 그룹 각각의 연결 요소들의 개수를 표현하는, N×N 2차원 매트릭스를 생성하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
7 |
7
제 1 항에 있어서,상기 생성된 연결 요소들의 크기값을 특성화하는 단계는,에 기초하여 수행되며,여기서 F는 연결 요소의 특성화된 크기값을 나타내고, α 및 β는 가중치 값들을 나타내며, H는 연결 요소의 높이(height)를 나타내며, W는 연결 요소의 폭(width)을 나타내고, 그리고 i는 연결 요소의 식별번호를 나타내는,문서 구조를 분석하기 위한 방법
|
8 |
8
제 1 항에 있어서,시그모이드 함수(sigmoid function)를 사용하여 상기 생성된 퍼지 에너지 매트릭스(FEM)를 정규화하는 단계를 더 포함하며, 그리고상기 텍스트 부분과 비-텍스트 부분을 구별하여 인식하는 단계는:상기 정규화된 퍼지 에너지 매트릭스에 사전결정된 임계값을 적용함으로써 상기 입력된 이미지에서의 텍스트 부분과 비-텍스트 부분을 구별하여 인식하는 단계를 포함하는,문서 구조를 분석하기 위한 방법
|
9 |
9
제 1 항에 있어서,상기 이진화된 이미지를 생성하는 단계는,하나의 임계값을 설정하는 전역(global) 이진화 알고리즘을 통해 생성된 이진화 이미지 및 미리결정된 크기의 윈도우를 슬라이딩함으로써 지역적인 임계값을 설정하는 지역(local) 이진화 알고리즘을 통해 생성된 이진화 이미지를 합성하는 단계를 포함하는,문서 구조를 분석하기 위한 방법
|
10 |
10
제 1 항에 있어서,상기 입력된 이미지는 RGB 모델로 표현된 이미지를 포함하며,상기 방법은,상기 입력된 이미지가 Gray 모델로 표현되도록 상기 입력된 이미지를 변환하는 단계;를 더 포함하는,문서 구조를 분석하기 위한 방법
|
11 |
11
제 1 항에 있어서,상기 이진화된 이미지를 생성하는 단계는,상기 입력된 이미지의 크기를 미리결정된 비율로 축소 변환(down-sampling)하는 단계; 및상기 축소 변환된 이미지에 상기 사전결정된 이진화 기법을 적용함으로써 상기 이진화된 이미지를 생성하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
12 |
12
제 11 항에 있어서,상기 입력된 이미지의 크기를 미리결정된 비율로 축소 변환하는 단계는,사용자 장비(UE:User Equipment)의 프로세서 성능에 따라서 상기 입력된 이미지의 크기를 축소 변환하는 단계를 포함하는,문서 구조를 분석하기 위한 방법
|
13 |
13
제 1 항에 있어서,포스트 프로세싱(post processing)을 수행하는 단계를 더 포함하며,상기 포스트 프로세싱을 수행하는 단계는:비-텍스트로 인식된 영역들을 분류하는 단계; 및텍스트로 인식된 영역들에 대한 텍스트 경계(boundary)를 정의하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
14 |
14
제 13 항에 있어서,상기 비-텍스트로 인식된 영역들을 분류하는 단계는:상기 비-텍스트로 인식된 영역에 위치한 특성화된 크기값 그룹의 연결요소들을 카운팅함으로써 상기 이미지에서의 테이블을 검출하는 단계;상기 비-텍스트로 인식된 영역의 가로와 세로의 비율(ratio)을 결정함으로써 상기 이미지에서의 구분자(separator)를 정의하는 단계; 및연결 요소들의 크기값에 따라서 상기 이미지에서의 노이즈를 결정하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
15 |
15
제 13 항에 있어서,상기 텍스트 경계를 정의하는 단계는,텍스트로 인식된 영역에 모포로지 가로 확장 알고리즘(morphology horizontal dilation algorithm)을 적용시킴으로써 모포로지 결과 이미지를 생성하는 단계;상기 생성된 모포로지 결과 이미지에 가로 및 세로의 프로젝션 알고리즘을 적용하여 블랙 영역으로 구성된 배경(background)을 추출하는 단계; 및상기 블랙 영역으로 구성된 배경에서의 경계 부분에 대한 경계선을 생성하는 단계;를 포함하는,문서 구조를 분석하기 위한 방법
|
16 |
16
컴퓨터-판독가능 매체에 저장된 컴퓨터 프로그램으로서,상기 컴퓨터 프로그램은 컴퓨터로 하여금 이하의 동작들을 수행하도록 하며, 상기 동작들은:입력된 이미지에 사전결정된 이진화(binarization) 기법을 적용함으로써 이진화된 이미지를 생성하는 동작;상기 생성된 이진화된 이미지에 연결 요소 알고리즘(connected component algorithm)을 적용함으로써 연결 요소들을 생성하는 동작;상기 생성된 연결 요소들의 기하학적 성질(geometrical property)에 기초하여 상기 연결 요소들 각각의 크기값을 특성화하는 동작;상기 연결 요소들의 특성화된 크기값에 적어도 부분적으로 기초하여 퍼지 에너지 매트릭스(FEM:Fuzzy Energy Matrix)를 생성하는 동작; 및상기 생성된 퍼지 에너지 매트릭스를 기초로 하여 상기 입력된 이미지에서의 텍스트 부분과 비-텍스트 부분을 구별하여 인식하는 동작;을 포함하는,컴퓨터 프로그램
|
17 |
17
문서 구조 분석 장치로서,입력된 이미지에 사전결정된 이진화(binarization) 기법을 적용함으로써 이진화된 이미지를 생성하는 이진화 유닛;상기 생성된 이진화된 이미지에 연결 요소 알고리즘(connected component algorithm)을 적용함으로써 연결 요소들을 생성하는 연결 요소 생성 유닛;상기 생성된 연결 요소들의 기하학적 성질(geometrical property)에 기초하여 상기 연결 요소들 각각의 크기값을 특성화하는 연결 요소 특성화 유닛;상기 연결 요소들의 특성화된 크기값에 적어도 부분적으로 기초하여 퍼지 에너지 매트릭스(FEM:Fuzzy Energy Matrix)를 생성하는 FEM 생성 유닛; 및상기 생성된 퍼지 에너지 매트릭스를 기초로 하여 상기 입력된 이미지에서의 텍스트 부분과 비-텍스트 부분을 구별하여 인식하는 텍스트 인식 유닛;문서 구조를 분석 장치
|