요약 | 본 발명은 한글, 한자, 영·수·부호 문자가 혼용된 다국어 문서(multilingual document)를 대상으로 하는 개별 문자 추출(individual character extraction) 방법 및 그 인식 시스템에 관한 것이다.본 발명은 다양한 폰트 크기, 하나의 글자가 두 조각으로 가로 분리되는 문자, 그리고 붙은 문자나 겹친 문자와 같은 다국어 문서에서 많이 발생되는 문자 분리시의 어려움을 해결한 개별 문자 추출 방법을 제공한다.본 발명의 상기 개별 문자 추출 방법은 문자 인식기의 결과값을 이용하는 방법으로 수직 화소 투영에 의한 1차 문자 추출 과정, 두 조각 이상으로 가로 분리된 문자를 병합할지를 판정하고 병합을 수행하는 2차 문자 추출 과정, 그리고 붙은 문자나 겹친 문자를 재 분리 할지를 판정하고 재분리 대상에 대해 재분리를 수행하는 3차 문자 추출 과정으로 구성되는 방법을 제공한다. 상기 2차 문자 추출 과정과 3차 문자 추출 과정에서의 판정 단계에서는 다단계 인식기를 통해 얻어진 결과값인 두개의 인식 정합도를 이용함을 특징으로 한다. |
---|---|
Int. CL | G06F 17/00 (2006.01) G06Q 50/10A0 (2008.03) |
CPC | G06Q 50/10A0(2013.01) G06Q 50/10A0(2013.01) G06Q 50/10A0(2013.01) G06Q 50/10A0(2013.01) |
출원번호/일자 | 1019970067558 (1997.12.10) |
출원인 | 한국전자통신연구원 |
등록번호/일자 | 10-0248384-0000 (1999.12.17) |
공개번호/일자 | 10-1998-0004113 (1998.03.30) 문서열기 |
공고번호/일자 | (20000315) 문서열기 |
국제출원번호/일자 | |
국제공개번호/일자 | |
우선권정보 | |
법적상태 | 소멸 |
심사진행상태 | 수리 |
심판사항 | |
구분 | 신규 |
원출원번호/일자 | |
관련 출원번호 | |
심사청구여부/일자 | Y (1997.12.10) |
심사청구항수 | 4 |