1 |
1
영상으로부터 문자를 인식하여 디지털 문서를 생성하고, 생성된 디지털 문서를 생성하는 제어부; 및상기 디지털 문서를 출력하는 입출력부를 포함하고,상기 제어부는,영상에 포함된 문자로부터 언어를 구분하는 언어 구분기;구분된 언어의 문자를 문자의 기본단위로 분할하는 문자 분할기; 및기본단위로 분할된 문자를 인식하고 인식된 문자를 사용하여 상기 디지털 문서를 생성하는 문자 인식기를 포함하되,상기 언어 구분기, 상기 문자 분할기 및 상기 문자 인식기 각각은 상기 문자 인식을 위해 콘볼루션 신경망을 사용하여 학습하거나 학습된 데이터를 사용하는 문자 인식 장치
|
2 |
2
제 1 항에 있어서,상기 문자 분할기는,상기 콘볼루션 신경망과 순환 신경망이 연결된 구조를 사용하여 상기 문자를 분할하는 문자 인식 장치
|
3 |
3
제 1 항에 있어서,상기 언어 구분기는,상기 영상으로부터 소정 개수의 채널로 구성된 특징맵을 생성하여 다음 콘볼루션 레이어로 전달하며, 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어; 및상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵으로부터 평균값을 계산하고, 계산된 평균값을 미리 설정된 임계값과 비교하여 상기 영상에 포함된 언어를 구분하는 평균 연산기를 포함하는 문자 인식 장치
|
4 |
4
제 1 항에 있어서,상기 문자 분할기는,상기 영상으로부터 소정 개수의 채널로 구성된 특징맵을 생성하여 다음 콘볼루션 레이어로 전달하며, 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어;상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵을 순차적인 데이터의 구조로 변환하는 양방향장단기메모리(BDLSTM);상기 문자의 경계 판단을 위한 정보를 시간 단위로 처리하는 제 1 전체 연결 레이어; 및상기 시간 단위로 처리된 정보를 사용하여 단위 문자의 경계 영역을 구분하는 분할 판정기를 포함하는 문자 인식 장치
|
5 |
5
제 3 항과 제 4 항 중 어느 한 항에 있어서,상기 복수의 콘볼루션 레이어 각각은,입력된 영상 또는 특징맵에 대해 높이 성분(H), 가로 성분(W) 및 채널 성분(C) 중에서 가로 성분(W)을 고정시켜, 상기 복수의 콘볼루션 레이어 각각에서 출력되는 특징값의 가로 성분(W)을 동일한 값으로 유지시키는 문자 인식 장치
|
6 |
6
제 1 항에 있어서,상기 문자 인식기는,상기 분할된 문자에 제로 패딩을 하는 제로 패딩부;상기 제로 패딩된 문자로부터 소정 개수의 채널로 구성된 특징맵을 생성하여 다음 콘볼루션 레이어로 전달하며, 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어;상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵에 대응되는 문자를 판별하는 제 2 전체 연결 레이어; 및상기 판별된 문자를 확률적인 값으로 정규화해서 대응되는 문자를 인식하는 정규화 처리기를 포함하는 문자 인식 장치
|
7 |
7
문자 인식 장치의 문자 인식 방법에 있어서,영상에 포함된 문자로부터 언어를 구분하는 단계;구분된 언어의 문자를 문자의 기본단위로 분할하는 단계; 및기본단위로 분할된 문자를 인식하고 인식된 문자를 사용하여 디지털 문서를 생성하는 단계를 포함하되,상기 구분하는 단계, 상기 분할하는 단계, 및 상기 디지털 문서를 생성하는 단계 각각은 콘볼루션 신경망을 사용하여 학습하거나 학습된 데이터를 사용하는 단계를 포함하는 문자 인식 방법
|
8 |
8
제 7 항에 있어서,상기 분할하는 단계는,상기 콘볼루션 신경망과 순환 신경망이 연결된 구조를 사용하여 상기 문자를 분할하는 단계를 포함하는 문자 인식 방법
|
9 |
9
제 7 항에 있어서,상기 언어를 구분하는 단계는,상기 영상으로부터 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어를 경유하여 생성된 소정 개수의 채널로 구성된 특징맵을 다음 콘볼루션 레이어로 전달하는 단계;상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵으로부터 평균값을 계산하는 단계; 및계산된 평균값을 미리 설정된 임계값과 비교하여 상기 영상에 포함된 언어를 구분하는 단계를 포함하는 문자 인식 방법
|
10 |
10
제 7 항에 있어서,상기 분할하는 단계는,상기 영상으로부터 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어를 경유하여 소정 개수의 채널로 구성된 특징맵을 생성하여 다음 콘볼루션 레이어로 전달하는 단계;상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵을 순차적인 데이터의 구조로 변환하는 단계;상기 문자의 경계 판단을 위한 정보를 시간 단위로 처리하는 단계; 및상기 시간 단위로 처리된 정보를 사용하여 단위 문자의 경계 영역을 구분하는 단계를 포함하는 문자 인식 방법
|
11 |
11
제 9 항과 제 10 항 중 어느 한 항에 있어서,상기 복수의 콘볼루션 레이어 각각은,입력된 영상 또는 특징맵에 대해 높이 성분(H), 가로 성분(W) 및 채널 성분(C) 중에서 가로 성분(W)을 고정시켜, 상기 복수의 콘볼루션 레이어 각각에서 출력되는 특징값의 가로 성분(W)을 동일한 값으로 유지시키는 문자 인식 방법
|
12 |
12
제 7 항에 있어서,상기 디지털 문서를 생성하는 단계는,상기 분할된 문자에 제로 패딩을 하는 단계;상기 제로 패딩된 문자로부터 직렬로 연결된 구조를 갖는 복수의 콘볼루션 레이어를 경유하여 생성된 소정 개수의 채널로 구성된 특징맵을 다음 콘볼루션 레이어로 전달하는 단계;상기 복수의 콘볼루션 레이어 중에서 마지막 콘볼루션 레이어의 특징맵에 대응되는 문자를 판별하는 단계; 및상기 특징맵을 구분한 정보를 확률적인 값으로 정규화해서 문자를 인식하는 단계를 포함하는 문자 인식 방법
|
13 |
13
제 7 항에 기재된 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
|
14 |
14
문자 인식 장치에 의해 수행되며, 제 7 항에 기재된 방법을 수행하기 위해 매체에 저장된 컴퓨터 프로그램
|