맞춤기술찾기

이전대상기술

HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법

  • 기술번호 : KST2018016636
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치 및 그 방법에 관한 것으로, 본 발명의 일실시예에 따른 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치는, 기 학습된 웹사이트별로 정보 종류에 따른 태그정보를 저장하기 위한 태그정보DB; 정보 추출 대상 웹페이지의 HTML 분석을 통해 웹페이지 정보를 확인하기 위한 HTML 분석부; 상기 웹페이지 정보가 상기 저장된 태그정보와 사용자에 의해 지정된 추출 정보 종류에 매칭되는지를 확인하기 위한 매칭부; 상기 매칭 결과에 따라, 상기 저장된 태그정보의 태그 식별자(Tag ID)를 이용하여 상기 정보 추출 대상 웹페이지의 태그정보를 추론하기 위한 추론부; 및 상기 추론된 태그정보에 따라 정보를 추출하기 위한 정보추출부;를 포함한다.
Int. CL G06F 16/00 (2019.01.01)
CPC G06F 16/955(2013.01)
출원번호/일자 1020170076686 (2017.06.16)
출원인 국방과학연구소
등록번호/일자 10-1992748-0000 (2019.06.19)
공개번호/일자 10-2018-0137256 (2018.12.27) 문서열기
공고번호/일자 (20190625) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.06.16)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이동환 대한민국 서울특별시 서초구
2 류호찬 대한민국 서울특별시 노원구
3 고병욱 대한민국 서울특별시 노원구
4 김동주 대한민국 서울특별시 노원구
5 박재하 대한민국 서울특별시 노원구
6 이수현 대한민국 서울특별시 노원구
7 임창완 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 한양특허법인 대한민국 서울특별시 강남구 논현로**길 **, 한양빌딩 (도곡동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 국방과학연구소 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.06.16 수리 (Accepted) 1-1-2017-0578460-13
2 의견제출통지서
Notification of reason for refusal
2018.12.19 발송처리완료 (Completion of Transmission) 9-5-2018-0874905-86
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.02.12 수리 (Accepted) 1-1-2019-0147801-72
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.02.12 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0147800-26
5 등록결정서
Decision to grant
2019.06.18 발송처리완료 (Completion of Transmission) 9-5-2019-0433911-18
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
웹사이트별로 정보 종류에 따른 태그정보를 저장하기 위한 태그정보DB;정보 추출 대상 웹페이지의 HTML 분석을 통해 웹페이지 정보를 확인하기 위한 HTML 분석부;상기 웹페이지 정보를 이용하여 상기 저장된 태그정보와 사용자에 의해 지정된 추출 정보 종류에 매칭되는지를 확인하기 위한 매칭부;상기 저장된 태그정보의 정보 종류와 상기 추출 정보 종류가 매칭되지 않은 경우에, 상기 저장된 태그정보의 태그 식별자(Tag ID)를 이용하여 상기 정보 추출 대상 웹페이지의 태그정보를 추론하기 위한 추론부; 및상기 추론된 태그정보에 따라 상기 정보 추출 대상 웹페이지의 추출 정보를 추출하기 위한 정보추출부;를 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
2 2
제 1 항에 있어서,상기 정보 추출 대상 웹페이지에 접속하고, 상기 추출 정보 종류를 입력할 수 있는 인터페이스 환경을 사용자에게 제공하는 사용자 인터페이스부; 및상기 정보 추출 대상 웹페이지에 대해, 상기 사용자 인터페이스부를 통해 사용자에 의해 상기 정보 추출 대상 웹페이지에 나타난 내용을 입력받는 수동 학습을 통해 생성된 태그정보를 상기 태그정보DB에 등록하기 위한 학습부;를 더 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
3 3
제 1 항에 있어서,상기 추출된 정보를 시간순서에 따라 저장하기 위한 추출정보DB;를 더 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
4 4
제 1 항에 있어서,상기 태그정보DB는,상기 태그정보를 Xpath(XML Path Language)를 이용하여 정규 표현 형식으로 저장 및 관리하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
5 5
제 1 항에 있어서,상기 웹페이지 정보는, 웹사이트 식별자 및 HTML 소스코드가 포함되는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
6 6
제 1 항에 있어서,상기 추론부는,상기 저장된 태그정보의 태그 식별자를 최소 단위 문자열로 구분하여 빈도수에 따라 상기 정보 추출 대상 웹페이지의 태그정보를 추론하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
7 7
제 2 항에 있어서,상기 학습부는,상기 태그정보DB에 초기 태그정보를 생성하거나, 상기 추론부가 상기 정보 추출 대상 웹페이지의 태그정보를 찾아내지 못한 경우에 동작하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
8 8
사용자에 의해 접속된 정보 추출 대상 웹페이지의 추출 정보 종류를 확인하는 단계;상기 정보 추출 대상 웹페이지의 HTML 분석을 통해 웹페이지 정보를 확인하는 단계;상기 웹페이지 정보가 저장된 태그정보와 상기 추출 정보 종류에 매칭되는지를 확인하는 단계;상기 저장된 태그정보의 정보 종류와 상기 추출 정보 종류가 매칭되지 않은 경우에, 상기 저장된 태그정보의 태그 식별자(Tag ID)를 이용하여 상기 정보 추출 대상 웹페이지의 태그정보를 추론하는 단계; 및상기 추론된 태그정보에 따라 상기 정보 추출 대상 웹페이지의 추출 정보를 추출하여 저장하는 단계;를 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 방법
9 9
제 8 항에 있어서,상기 추론하는 단계에서 상기 정보 추출 대상 웹페이지의 태그정보에 대한 추론이 실패하는 경우에, 사용자에 의해 상기 정보 추출 대상 웹페이지에 나타난 내용을 입력받는 수동 학습을 통해 생성된 태그정보를 등록하고, 상기 등록된 태그정보에 따라 상기 정보 추출 대상 웹페이지의 추출 정보를 추출하여 저장하는 단계;를 더 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 방법
10 10
제 8 항에 있어서,상기 태그정보는, Xpath(XML Path Language)를 이용하여 정규 표현 형식으로 나타나는 것인 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 방법
11 11
제 8 항에 있어서,상기 웹페이지 정보는, 웹사이트 식별자 및 HTML 소스코드가 포함되는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 방법
12 12
제 8 항에 있어서,상기 추론 단계는,상기 저장된 태그정보의 태그 식별자를 최소 단위 문자열로 구분하여 빈도수에 따라 상기 정보 추출 대상 웹페이지의 태그정보를 추론하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 방법
13 13
정보 추출 대상 웹페이지의 HTML 분석을 통해 확인된 웹페이지 정보를 기 저장된 태그정보와 사용자에 의해 지정된 추출 정보 종류에 매칭함에 따라, 상기 저장된 태그정보를 이용하여 상기 정보 추출 대상 웹페이지의 태그정보를 추론하여 상기 정보 추출 대상 웹페이지의 추출 정보를 추출하기 위한 태그 추론부; 및상기 정보 추출 대상 웹페이지의 태그정보에 대한 추론이 실패하는 경우에, 상기 정보 추출 대상 웹페이지에 대해, 사용자에 의해 상기 정보 추출 대상 웹페이지에 나타난 내용을 입력받는 수동 학습을 통해 생성된 태그정보를 상기 태그 추론부에 제공하기 위한 태그 학습부;를 포함하는 HTML 태그정보의 추론 및 학습을 통한 웹페이지 정보 추출 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.