맞춤기술찾기

이전대상기술

분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치 및 방법(Apparatus and method for collecting and analysing HTML5 documents based a distributed parallel processing)

  • 기술번호 : KST2016014274
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치 및 방법이 제공된다. 상기 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치는, Root URL 정보를 제1 데이터베이스에 저장하는 인젝터(injector) 모듈, 상기 제1 데이터베이스로부터 상기 Root URL 정보를 제공받아 수집 대상 URL 리스트를 생성하고, 상기 수집 대상 URL 리스트를 제2 데이터베이스에 저장하는 제너레이터(generator) 모듈, 상기 제2 데이터베이스로부터 상기 수집 대상 URL 리스트를 제공받아 상기 수집 대상 URL 리스트에 대응되는 웹 페이지로부터 컨텐츠를 추출하고, 상기 컨텐츠를 상기 제2 데이터베이스에 저장하는 페처(fetcher) 모듈, 상기 제2 데이터베이스로부터 상기 컨텐츠를 제공받아 상기 컨텐츠의 내용을 파싱하여 파싱 결과 정보를 생성하고, 상기 파싱 결과 정보를 상기 제2 데이터베이스에 저장하는 파싱(parsing) 모듈, 상기 파싱 모듈로부터 상기 파싱 결과 정보를 제공받아 상기 웹 페이지의 문서 타입이 HTML5인지 판단하는 필터(filter) 모듈, 및 상기 웹 페이지의 문서 타입이 HTML5인 경우에만 상기 컨텐츠에 포함된 HTML 코드의 취약점(vulnerability)을 분석하는 취약점 분석 모듈을 포함하되, 상기 취약점 분석 모듈은 상기 컨텐츠를 복수의 서브 컨텐츠로 스플릿(split)하고, 상기 서브 컨텐츠에 대해서 키워드와 속성을 추출하고, 상기 키워드 및 상기 속성의 빈도수를 연산하여 상기 컨텐츠의 취약점을 분석한다.
Int. CL G06F 21/57 (2013.01) G06F 9/38 (2006.01) G06F 17/30 (2006.01)
CPC G06F 21/577(2013.01) G06F 21/577(2013.01) G06F 21/577(2013.01)
출원번호/일자 1020150009712 (2015.01.21)
출원인 한국인터넷진흥원
등록번호/일자 10-1650316-0000 (2016.08.17)
공개번호/일자 10-2016-0089995 (2016.07.29) 문서열기
공고번호/일자 (20160823) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.01.21)
심사청구항수 19

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국인터넷진흥원 대한민국 전라남도 나주시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김환국 대한민국 서울특별시 송파구
2 정종훈 대한민국 서울특별시 강동구
3 배한철 대한민국 서울특별시 송파구
4 추현록 대한민국 서울특별시 송파구
5 장웅 대한민국 경기도 성남시 중원구
6 오상환 대한민국 경기도 성남시 중원구
7 윤수진 대한민국 대구광역시 중구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인가산 대한민국 서울 서초구 남부순환로 ****, *층(서초동, 한원빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국인터넷진흥원 전라남도 나주시
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2015.01.21 수리 (Accepted) 1-1-2015-0063431-96
2 [특허출원]특허출원서
[Patent Application] Patent Application
2015.01.21 수리 (Accepted) 1-1-2015-0061950-23
3 선행기술조사의뢰서
Request for Prior Art Search
2015.11.12 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2016.01.07 발송처리완료 (Completion of Transmission) 9-6-2016-0008717-74
5 의견제출통지서
Notification of reason for refusal
2016.02.01 발송처리완료 (Completion of Transmission) 9-5-2016-0085321-68
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.03.22 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-0273578-47
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.03.22 수리 (Accepted) 1-1-2016-0273605-93
8 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2016.05.26 수리 (Accepted) 1-1-2016-0507723-49
9 등록결정서
Decision to grant
2016.08.12 발송처리완료 (Completion of Transmission) 9-5-2016-0580471-20
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.11.15 수리 (Accepted) 4-1-2017-5183538-19
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
Root URL 정보를 제1 데이터베이스에 저장하는 인젝터(injector) 모듈;상기 제1 데이터베이스로부터 상기 Root URL 정보를 제공받아 수집 대상 URL 리스트를 생성하고, 상기 수집 대상 URL 리스트를 제2 데이터베이스에 저장하는 제너레이터(generator) 모듈;상기 제2 데이터베이스로부터 상기 수집 대상 URL 리스트를 제공받아 상기 수집 대상 URL 리스트에 대응되는 웹 페이지로부터 컨텐츠를 추출하고, 상기 컨텐츠를 상기 제2 데이터베이스에 저장하는 페처(fetcher) 모듈; 상기 제2 데이터베이스로부터 상기 컨텐츠를 제공받아 상기 컨텐츠의 내용을 파싱하여 파싱 결과 정보를 생성하고, 상기 파싱 결과 정보를 상기 제2 데이터베이스에 저장하는 파싱(parsing) 모듈;상기 파싱 모듈로부터 상기 파싱 결과 정보를 제공받아 상기 웹 페이지의 문서 타입이 HTML5인지 판단하는 필터(filter) 모듈; 및상기 웹 페이지의 문서 타입이 HTML5인 경우에만 상기 컨텐츠에 포함된 HTML 코드의 취약점(vulnerability)을 분석하는 취약점 분석 모듈을 포함하되,상기 취약점 분석 모듈은 상기 컨텐츠를 복수의 서브 컨텐츠로 스플릿(split)하고, 상기 서브 컨텐츠에 포함된 태그를 트리 구조로 정렬하여 키워드와 속성을 추출하고, 상기 키워드 및 상기 속성의 빈도수를 연산하여 상기 컨텐츠의 취약점을 분석하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
2 2
삭제
3 3
제 1항에 있어서,상기 제2 데이터베이스로부터 상기 파싱 결과 정보를 제공받아 상기 제1 데이터베이스에 저장된 정보를 업데이트하는 업데이터(updater) 모듈을 더 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
4 4
제 3항에 있어서,상기 페처 모듈은, 상기 컨텐츠에 관한 컨텐츠 수집 정보를 생성하고, 상기 컨텐츠 수집 정보를 상기 제2 데이터베이스에 더 저장하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
5 5
제 4항에 있어서,상기 업데이터 모듈은, 상기 제2 데이터베이스로부터 상기 컨텐츠 수집 정보를 제공받아 상기 제1 데이터베이스에 저장된 정보를 업데이트하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
6 6
제 1항에 있어서,상기 제1 데이터베이스는, 상기 Root URL 정보를 제1 포맷으로 변환하여 저장하고,상기 제1 포맷은, URL, 수집 상태, 수집 시간, 수집된 이후 재시도 횟수, 및 문서 형식에 관한 정보를 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
7 7
제 6항에 있어서,상기 제2 데이터베이스는, 상기 컨텐츠를 제2 포맷으로 변환하여 저장하고, 상기 제2 포맷은, 상기 제1 포맷에 포함된 정보와, 상기 웹 페이지의 HTML 내용을 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
8 8
제 7항에 있어서,상기 제2 데이터베이스는, 상기 컨텐츠를 파싱한 형태의 아웃링크(outlink) 주소 및 상기 아웃링크를 텍스트 라인 단위로 저장한 형태를 더 저장하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
9 9
제 1항에 있어서,상기 취약점에 관한 정보를 저장하는 제3 데이터베이스를 더 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
10 10
제 1항에 있어서,상기 Root URL 정보는, 수집 대상 URL을 포함하는 웹 페이지의 메인 URL 정보인 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
11 11
데이터베이스;제1 웹 페이지의 Root URL 정보를 추출하여 상기 데이터베이스에 저장하는 인젝터(injector) 모듈;상기 Root URL 정보를 제공받아 수집 대상 URL 리스트를 생성하고, 상기 수집 대상 URL 리스트를 상기 데이터베이스에 저장하는 제너레이터(generator) 모듈; 상기 수집 대상 URL 리스트를 제공받아 대응되는 제2 웹 페이지로부터 컨텐츠를 추출하고, 상기 컨텐츠를 상기 데이터베이스에 저장하는 페처(fetcher) 모듈;상기 컨텐츠를 제공받아 파싱하고, 파싱 결과 정보를 생성하고, 상기 파싱 결과 정보를 상기 데이터베이스에 저장하는 파싱(parsing) 모듈;상기 파싱 결과 정보를 제공받아 상기 제2 웹 페이지의 문서 타입이 HTML5인지 판단하는 필터(filter) 모듈; 및상기 제2 웹 페이지의 문서 타입이 HTML5인 경우에만 상기 컨텐츠에 포함된 HTML 코드의 취약점(vulnerability)을 분석하는 취약점 분석 모듈을 포함하되,상기 취약점 분석 모듈은 상기 컨텐츠를 복수의 서브 컨텐츠로 스플릿(split)하고, 상기 서브 컨텐츠에 포함된 태그를 트리 구조로 정렬하여 키워드와 속성을 추출하고, 상기 키워드 및 상기 속성의 빈도수를 연산하여 상기 컨텐츠의 취약점을 분석하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
12 12
삭제
13 13
제 11항에 있어서,상기 페처 모듈은, 상기 컨텐츠에 관한 컨텐츠 수집 정보를 생성하고, 상기 컨텐츠 수집 정보를 상기 데이터베이스에 더 저장하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
14 14
제 11항에 있어서,상기 데이터베이스는, 상기 Root URL 정보를 제1 포맷으로 변환하여 저장하고,상기 제1 포맷은, URL, 수집 상태, 수집 시간, 수집된 이후 재시도 횟수, 및 문서 형식에 관한 정보를 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
15 15
제 14항에 있어서,상기 데이터베이스는, 상기 컨텐츠를 제2 포맷으로 변환하여 저장하고, 상기 제2 포맷은, 상기 제1 포맷에 포함된 정보와, 상기 제2 웹 페이지의 HTML 내용을 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
16 16
제 15항에 있어서,상기 데이터베이스는, 상기 컨텐츠를 파싱한 형태의 아웃링크(outlink) 주소 및 상기 아웃링크를 텍스트 라인 단위로 저장한 형태를 더 저장하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
17 17
제 11항에 있어서,상기 Root URL 정보는, 수집 대상 URL을 포함하는 상기 제1 웹 페이지의 메인 URL 정보인 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 장치
18 18
Root URL 정보를 기초로 하여, 수집 대상 URL 리스트를 생성하고,상기 수집 대상 URL 리스트에 대응되는 웹 페이지로부터 컨텐츠를 추출하고,상기 컨텐츠의 내용을 파싱하여 파싱 결과 정보를 생성하고,상기 파싱 결과 정보를 기초로 하여, 상기 웹 페이지의 문서 타입이 HTML5인지 판단하고,상기 웹 페이지의 문서 타입이 HTML5인 경우에만 상기 컨텐츠에 포함된 HTML 코드의 취약점(vulnerability)을 분석하는 것을 포함하되, 상기 컨텐츠를 복수의 서브 컨텐츠로 스플릿(split)하고, 상기 서브 컨텐츠에 포함된 태그를 트리 구조로 정렬하여 키워드와 속성을 추출하고, 상기 키워드 및 상기 속성의 빈도수를 연산하여 상기 컨텐츠의 취약점을 분석하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 방법
19 19
삭제
20 20
제 18항에 있어서,상기 Root URL 정보를 데이터베이스에 저장하는 것을 더 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 방법
21 21
제 20항에 있어서,상기 수집 대상 URL 리스트 및 상기 컨텐츠를 상기 데이터베이스에 저장하는 것을 더 포함하는 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 방법
22 22
제 18항에 있어서,상기 Root URL 정보는, 수집 대상 URL을 포함하는 웹 페이지의 메인 URL 정보인 분산 병렬 처리 기반의 HTML5 문서 수집 및 분석 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한국인터넷진흥원 정보보호핵심원천기술개발(R&D) 스크립트 기반 사이버 공격 사전 예방 및 대응 기술 개발