맞춤기술찾기

이전대상기술

XML 생성 시스템 및 방법

  • 기술번호 : KST2015206837
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 저널이나 논문과 같은 문서로부터 효과적으로 XML 생성하여 생산성을 높이며 각 논문이나 각 저널의 구성 상이로 인해 자동화하기 어려운 부분에 대해 사용자가 원하는 XML의 생산이 용이하게 하기 위함이다. 이를 위해 본 발명은, 적어도 하나 이상의 시각적 콘텐트를 포함하는 파일을 입력 받는 단계, 시각적 콘텐트를 좌표화하여 HTML 형태의 텍스트 데이터를 추출하는 단계; 파일의 각 페이지를 이미지로 변환하여 저장하는 단계; 저장된 이미지에 포함된 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록 영역을 추출하고 가시화하는 단계; 사용자의 입력 신호에 따라 가시화된 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 레이아웃을 수정하는 단계; 수정된 레이아웃에 대응하는 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계를 포함한다.
Int. CL G06F 17/21 (2006.01)
CPC G06F 17/218(2013.01) G06F 17/218(2013.01)
출원번호/일자 1020140134458 (2014.10.06)
출원인 한국과학기술정보연구원
등록번호/일자 10-1500598-0000 (2015.03.03)
공개번호/일자
공고번호/일자 (20150310) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.10.06)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정유철 대한민국 대구광역시 중구
2 오흥선 대한민국 대전광역시 유성구
3 박재원 대한민국 대전광역시 유성구
4 최선희 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김용인 대한민국 서울특별시 송파구 올림픽로 ** (잠실현대빌딩 *층)(특허법인(유한)케이비케이)
2 지관영 대한민국 서울특별시 송파구 올림픽로 ** (잠실현대빌딩 *층)(특허법인(유한)케이비케이)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술정보연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.10.06 수리 (Accepted) 1-1-2014-0952058-31
2 [우선심사신청]심사청구(우선심사신청)서
[Request for Preferential Examination] Request for Examination (Request for Preferential Examination)
2014.10.13 수리 (Accepted) 1-1-2014-0971800-04
3 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2014.10.16 수리 (Accepted) 9-1-9999-9999999-89
4 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2014.10.20 수리 (Accepted) 9-1-2014-0084668-54
5 의견제출통지서
Notification of reason for refusal
2014.11.28 발송처리완료 (Completion of Transmission) 9-5-2014-0821497-79
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.01.20 수리 (Accepted) 1-1-2015-0059731-38
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.01.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0059730-93
8 등록결정서
Decision to grant
2015.02.26 발송처리완료 (Completion of Transmission) 9-5-2015-0133804-34
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 하나 이상의 시각적 콘텐트를 포함하는 파일을 입력 받는 단계로서, 상기 적어도 하나 이상의 시각적 콘텐트는 텍스트 콘텐트 또는 그림 콘텐트를 포함하고;상기 시각적 콘텐트를 좌표화하여 HTML 형태의 텍스트 데이터를 추출하는 단계;상기 파일의 각 페이지를 이미지로 변환하는 단계;상기 변환된 이미지에 포함된 상기 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록 영역을 추출하고 가시화하는 단계; 사용자의 입력 신호에 따라 상기 가시화된 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 레이아웃을 수정하는 단계; 및상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계를 포함하는 XML 생성방법
2 2
제1항에 있어서, 상기 시각적 콘텐트를 좌표화하여 HTML 형태의 텍스트 데이터를 추출하는 단계는, 상기 시각적 콘텐트가 텍스트 콘텐트인 경우, 상기 텍스트 콘텐트를 구성하는 각 문자의 위치 좌표, 폰트 크기, 서체 정보를 포함하는 정보를 추출하는 단계; 및상기 추출된 정보를 기반으로, 상기 추출된 위치 좌표의 일정 크기를 더한 좌표 내에 위치한 문자를 묶어 HTML 형태의 텍스트 데이터를 추출하는 단계를 더 포함하는 XML 생성방법
3 3
제1항에 있어서, 상기 파일의 각 페이지를 이미지로 변환하는 단계는,상기 변환된 이미지를 저장하는 단계를 더 포함하는 XML 생성방법
4 4
제1항에 있어서, 상기 변환된 이미지에 포함된 상기 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록 영역을 추출하고 가시화하는 단계는,상기 시각적 콘텐트가 텍스트 콘텐트인 경우, 문단 수준으로 묶을 수 있는 연속된 텍스트의 좌표를 획득하여 상기 콘텐트 블록 영역을 추출하는 것을 포함하는 XML 생성방법
5 5
제1항에 있어서, 상기 변환된 이미지에 포함된 상기 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록영역을 추출하고 가시화하는 단계는, 상기 시각적 콘텐트가 그림 콘텐트인 경우, 상기 HTML 형태의 텍스트 데이터로부터 상기 콘텐트 블록 영역의 좌표를 획득하거나 또는 상기 변환된 이미지를 Gray Scale변환, Binary Filter처리를 하여 흑 /백 변환 후 Erosion Size, Dilation Element, Dilation Size, Erosion Element 및 Canny Threshold를 조정하면서Contour를 찾는 방법으로 상기 콘텐트 블록 영역을 추출하는 것을 포함하는 XML 생성방법
6 6
제 1항에 있어서, 상기 사용자의 입력 신호에 따라 상기 가시화된 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 레이아웃을 수정하는 단계는,상기 수정된 레이아웃의 좌표를 저장하는 단계를 더 포함하는 XML 생성방법
7 7
제1항에 있어서, 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계는,상기 추출된 데이터가 그림 콘텐트에 대응하는 경우 콘텐트 블록 영역의 시작 좌표 및 끝 좌표 내에서 상기 데이터를 추출하는 것을 포함하는 XML 생성방법
8 8
제 1항에 있어서, 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계는,상기 추출된 데이터가 텍스트 콘텐트에 대응하는 경우 상기 HTML형태로 추출된 텍스트 데이터와 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역 중 텍스트 블록 영역에서 추출한 텍스트를 비교하여 보정하는 단계를 더 포함하는 XML 생성방법
9 9
제 1항에 있어서, 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계는, 상기 생성된 XML에 대한 유효성검사를 수행하는 단계를 더 포함하는 XML 생성방법
10 10
제 1항에 있어서, 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하여 XML을 생성하는 단계는, 상기 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 XML태그들을 부착하는 단계를 더 포함하는 XML 생성방법
11 11
적어도 하나 이상의 시각적 콘텐트를 포함하는 파일을 입력 받는 파일입력모듈로서, 상기 적어도 하나 이상의 시각적 콘텐트는 텍스트 콘텐트 또는 그림 콘텐트를 포함하고;상기 시각적 콘텐트를 좌표화하여 HTML 형태의 텍스트 데이터를 추출하는 HTML 형태의 텍스트 데이터 추출모듈;상기 파일의 각 페이지를 이미지로 변환하는 이미지변환모듈;상기 변환된 이미지에 포함된 상기 적어도 하나 이상의 시각적 콘텐트로부터 적어도 하나 이상의 콘텐트 블록 영역을 추출하고 가시화하는 레이아웃가시화 모듈; 사용자의 입력 신호에 따라 상기 가시화된 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 레이아웃을 수정하는 레이아웃수정모듈; 및상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역에 포함된 데이터를 추출하는 XML생성모듈을 포함하는 XML 생성시스템
12 12
제11항에 있어서, 상기 HTML 형태의 텍스트 데이터 추출모듈은,상기 시각적 콘텐트가 텍스트 콘텐트인 경우, 상기 텍스트 콘텐트를 구성하는 각 문자의 위치 좌표, 폰트 크기, 서체를 포함하는 정보를 추출하여 상기 추출된 정보를 기반으로 상기 추출된 위치 좌표의 일정 크기를 더한 좌표 내에 위치한 문자를 묶어 HTML 형태의 텍스트 데이터를 추출하는 것을 포함하는 XML 생성시스템
13 13
제11항에 있어서, 상기 이미지변환모듈은,상기 변환된 이미지를 저장하는 것을 포함하는 XML 생성시스템
14 14
제11항에 있어서, 상기 레이아웃가시화 모듈은, 상기 시각적 콘텐트가 텍스트 콘텐트인 경우, 문단 수준으로 묶을 수 있는 연속된 텍스트의 좌표를 획득하여 상기 콘텐트 블록 영역을 추출하는 것을 포함하는 XML 생성시스템
15 15
제11항에 있어서, 상기 레이아웃가시화 모듈은,상기 시각적 콘텐트가 그림 콘텐트인 경우, 상기 HTML 형태의 텍스트 데이터로부터 상기 콘텐트 블록영역의 좌표를 획득하거나 또는 상기 변환된 이미지를 Gray Scale변환, Binary Filter처리를 하여 흑 /백 변환 후 Erosion Size, Dilation Element, Dilation Size, Erosion Element 및 Canny Threshold를 조정하면서Contour를 찾는 방법으로 상기 콘텐트 블록 영역을 추출하는 것을 포함하는 XML 생성시스템
16 16
제 11항에 있어서, 상기 레이아웃수정모듈은,상기 수정된 레이아웃의 좌표를 저장하는 것을 포함하는 XML 생성시스템
17 17
제11항에 있어서, 상기 XML생성모듈은,상기 추출된 데이터가 그림 콘텐트에 대응하는 경우 콘텐트 블록 영역의 시작 좌표 및 끝 좌표 내에서 상기 데이터를 추출하는 것을 포함하는 XML 생성시스템
18 18
제 11항에 있어서, 상기 XML생성모듈은,상기 추출된 데이터가 텍스트 콘텐트에 대응하는 경우 상기 HTML형태로 추출된 텍스트 데이터와 상기 수정된 레이아웃에 대응하는 적어도 하나 이상의 콘텐트 블록 영역 중 텍스트 블록 영역에서 추출한 텍스트를 비교하여 보정하는 것을 포함하는 XML 생성시스템
19 19
제 11항에 있어서, 상기 XML생성모듈은, 상기 생성된 XML에 대한 유효성검사를 수행하는 것을 포함하는 XML 생성시스템
20 20
제 11항에 있어서, 상기 XML생성모듈은, 상기 적어도 하나 이상의 콘텐트 블록 영역에 대응하는 XML태그들을 부착하는 것을 포함하는 XML 생성시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.