요약 | 본 발명은 스캐너로 입력 받은 문서 영상에서 표(table) 영역을 찾아내고 표의 테두리선들을 내용과 분리하는 방법에 관한 것이다. 먼저, 스캐너로 입력한 문서 영상을 영역 해석하여 텍스트 영역과, 그림 영역으로 분할하고, 그림 영역으로 분할된 영역들을 흑점밀도 및 테두리선을 추출함으로써 그림 영역에서 표 영역을 분리한다.본 발명에 따라 표를 분석하는 방법은, 문서 영상을 텍스트 후보 영역과 그림 후보 영역으로 분리한 후, 분리된 그림 후보 영역을 분석하여 표의 테두리선들을 추출하는 문서 영상에서의 표 분석방법에 있어서, 상기 그림 후보 영역의 흑점밀도를 측정하여 표 후보 영역을 추출하는 제1단계와; 상기 표 후보 영역의 수평, 수직 테두리선을 추출하는 제2단계; 상기 표 후보 영역의 수평, 수직 테두리선 중 최외각 수평, 수직 테두리선들을 추출하고, 이를 기준으로 표 영역을 추출하는 제3단계; 및 상기 표 영역에서 제외된 표 후보 영역을 그림 영역으로 등록하는 제4단계를 포함한 것을 특징으로 한다. |
---|---|
Int. CL | G06T 9/00 (2006.01) |
CPC | G06T 7/13(2013.01) G06T 7/13(2013.01) G06T 7/13(2013.01) |
출원번호/일자 | 1019980043240 (1998.10.15) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-0277831-0000 (2000.10.13) |
공개번호/일자 | 10-2000-0025937 (2000.05.06) 문서열기 |
공고번호/일자 | (20010115) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 | |
법적상태 | 소멸 |
심사진행상태 | 수리 |
심판사항 | |
구분 | |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (1998.10.15) |
심사청구항수 | 7 |