1 |
1
하드웨어와 결합되어,문서 내 테이블을 인식하고, 상기 테이블을 구성하는 적어도 하나 이상의 최소 테이블 단위를 검출하는 과정;상기 최소 테이블 단위에 포함된 각 셀들을 라벨 및 데이터 중 어느 하나에 상응하는 셀로 분류하는 과정;상기 각 셀들에 대한 분류결과에 기반하여 상기 최소 테이블 단위에 해당하는 테이블 유형을 결정하는 과정; 및상기 분류결과 및 상기 테이블 유형을 기반으로 상기 라벨과 상기 데이터 사이의 관계를 추론한 분석 데이터를 생성하고, 상기 분석 데이터를 활용하여 지식맵 타입의 제품 사양정보를 추출하는 과정을 실행시키기 위하여 기록매체에 저장된 컴퓨터 프로그램
|
2 |
2
제 1항에 있어서,상기 검출하는 과정은,상기 테이블을 가로지는 가로선 및 세로선에 대한 분석정보를 기반으로 상기 테이블을 구성하는 각 셀들을 트리 구조의 노드로 정의하여 상기 최소 테이블 단위를 검출하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
3 |
3
제 1항에 있어서,상기 분류하는 과정은,상기 각 셀들의 구조 및 데이터 타입에 대한 특징 정보를 뉴럴 네트워크 기반의 학습 모델을 통해 학습하여 상기 각 셀들을 라벨 및 데이터 중 어느 하나에 상응하는 셀로 분류하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
4 |
4
제 3항에 있어서,상기 각 셀들의 구조에 대한 특징 정보는, 상기 각 셀을 중심으로 주변 셀들의 존재 여부, 셀의 색깔 및 테두리 두께 중 적어도 하나를 포함하며,상기 데이터 타입에 대한 특징 정보는, 상기 각 셀들에 대응되는 텍스트의 길이 및 내용 중 적어도 하나를 포함하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
5 |
5
제 3항에 있어서,상기 분류하는 과정은,상기 분류결과에 따라 상기 학습 모델 내 도메인 온톨로지 기반의 뉴럴 네트워크를 추가 활용하여 상기 각 셀들을 라벨 및 데이터 중 어느 하나에 상응하는 셀로 분류하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
6 |
6
제 1항에 있어서,상기 결정하는 과정은,상기 분류결과를 통해 확인되는 적어도 하나 이상의 상기 라벨의 위치를 기반으로 상기 라벨들 간의 구조적 관계를 판별하고, 판별결과에 따라 상기 테이블 유형을 기본 테이블 및 중첩된 테이블 중 어느 하나의 유형으로 결정하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
7 |
7
제 6항에 있어서,상기 결정하는 과정은,상기 최소 테이블 단위가 2차원의 테이블인 것으로 판별되는 경우 상기 최소 테이블 단위의 형태를 1차원의 테이블 형태로 변형시켜 상기 테이블 유형을 결정하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
8 |
8
제 1항에 있어서,상기 추출하는 과정은, 상기 라벨의 텍스트를 추출하고, 상기 텍스트에 품사 태그정보, 단어 수, 문자 수 및 상기 라벨에 매칭되는 데이터 셀의 값 중 적어도 하나의 텍스트 분석정보를 열거하여 상기 분석 데이터를 생성하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
9 |
9
제 8항에 있어서,상기 추출하는 과정은,상기 텍스트에 대하여 약어 처리 및 고유명사 처리 중 적어도 하나의 용어 전처리 과정을 수행하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
10 |
10
제 1항에 있어서,상기 추출하는 과정은, 상기 테이블 유형이 중첩된 테이블인 경우 상기 분석 데이터 내 정의된 라벨의 구조와 관련하여 패턴 정상화 과정을 적응적으로 수행하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
11 |
11
제 1항에 있어서,상기 추출하는 과정은,상기 분석 데이터를 기반으로, 기 제공되는 기본 제품 사양정보의 내용을 업데이트시켜 상기 문서에 상응하는 제품 사양정보를 추출하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
12 |
12
제 11항에 있어서,상기 추출하는 과정은,상기 분석 데이터 상에 매칭된 상기 라벨의 텍스트를 상기 기본 제품 사양정보 상에 매칭된 개체의 정보와 비교하여 업데이트 대상이되는 개체를 선별하고, 선별된 개체의 정보 상에 상기 라벨에 대응하는 분석 데이터의 내용을 매칭시키는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
13 |
13
제 11항에 있어서,상기 추출하는 과정은,상기 선별된 개체의 정보 상에 업데이트된 분석 데이터의 내용에 대한 유효성 여부를 판별하는 과정을 더 포함하는 것을 특징으로 하는 기록매체에 저장된 컴퓨터 프로그램
|
14 |
14
문서 내 테이블을 인식하고, 상기 테이블을 구성하는 적어도 하나 이상의 최소 테이블 단위를 검출하는 과정;상기 최소 테이블 단위에 포함된 각 셀들을 라벨 및 데이터 중 어느 하나에 상응하는 셀로 분류하는 과정;상기 각 셀들에 대한 분류결과에 기반하여 상기 최소 테이블 단위에 해당하는 테이블 유형을 결정하는 과정; 및상기 분류결과 및 상기 테이블 유형을 기반으로 상기 라벨과 상기 데이터 사이의 관계를 추론한 분석 데이터를 생성하고, 상기 분석 데이터를 활용하여 지식맵 타입의 제품 사양정보를 추출하는 과정을 포함하는 것을 특징으로 하는 테이블 분석방법
|
15 |
15
제 14항에 있어서,상기 추출하는 과정은,상기 분석 데이터를 기반으로, 기 제공되는 기본 제품 사양정보의 내용을 업데이트시켜 상기 문서에 상응하는 제품 사양정보를 추출하는 것을 특징으로 하는 테이블 분석방법
|
16 |
16
문서 내 테이블을 인식하고, 상기 테이블을 구성하는 적어도 하나 이상의 최소 테이블 단위를 검출하는 검출부;상기 최소 테이블 단위에 포함된 각 셀들을 라벨 및 데이터 중 어느 하나에 상응하는 셀로 분류하는 분류부;상기 각 셀들에 대한 분류결과에 기반하여 상기 최소 테이블 단위에 해당하는 테이블 유형을 결정하는 유형 결정부; 및상기 분류결과 및 상기 테이블 유형을 기반으로 상기 라벨과 상기 데이터 사이의 관계를 추론한 분석 데이터를 생성하고, 상기 분석 데이터를 활용하여 지식맵 타입의 제품 사양정보를 추출하는 데이터 추출부를 포함하는 것을 특징으로 하는 테이블 분석장치
|
17 |
17
제 16항에 있어서,상기 데이터 추출부는,상기 분석 데이터를 기반으로, 기 제공되는 기본 제품 사양정보의 내용을 업데이트시켜 상기 문서에 상응하는 제품 사양정보를 추출하는 것을 특징으로 하는 테이블 분석장치
|