맞춤기술찾기

이전대상기술

HTML 태그 정보를 이용한 웹 문서 임베딩 방법 및 장치

  • 기술번호 : KST2021010931
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 HTML 태그를 이용하여 웹 문서의 구조 및 중요도 파악에 높은 정확도를 갖도록 하는, HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 단계와, 상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 단계를 포함하는 웹 문서 임베딩 방법 및 장치가 제공된다. 종래의 단어 임베딩 방법에 비하여 더 중요도 있는 문장을 추출할 수 있으며, 향상된 성능의 문서 요약, 제목 예측이 가능하다.
Int. CL G06F 40/143 (2020.01.01) G06F 40/16 (2020.01.01) G06F 16/951 (2019.01.01) G06N 20/00 (2019.01.01)
CPC G06F 40/143(2013.01) G06F 40/16(2013.01) G06F 16/951(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020200013294 (2020.02.04)
출원인 성균관대학교산학협력단
등록번호/일자
공개번호/일자 10-2021-0099431 (2021.08.12) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.02.04)
심사청구항수 22

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 성균관대학교산학협력단 대한민국 경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이진호 경기도 수원시 장안구
2 이상헌 경기도 수원시 장안구
3 이지형 서울특별시 중구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.02.04 수리 (Accepted) 1-1-2020-0117775-48
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2020.12.07 수리 (Accepted) 1-1-2020-1324867-74
3 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2021.01.18 수리 (Accepted) 1-1-2021-0063606-86
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 단계; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 단계를 포함하는, 웹 문서 임베딩 방법
2 2
제1항에 있어서,상기 단어 임베딩을 수행하는 단계는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 각각 벡터화하는 단계; 및벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는 단계를 포함하는, 웹 문서 임베딩 방법
3 3
제2항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 방법
4 4
제3항에 있어서,상기 임베딩 모델을 학습시키는 단계는상기 가중치 행렬을 학습시키는 단계를 포함하는, 웹 문서 임베딩 방법
5 5
제2항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 방법
6 6
제1항에 있어서,상기 단어 임베딩을 수행하는 단계는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 방법
7 7
제1항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 방법
8 8
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 웹 문서 수집부; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 단어 임베딩부를 포함하는, 웹 문서 임베딩 장치
9 9
제8항에 있어서,상기 단어 임베딩부는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 벡터화하고, 벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는, 웹 문서 임베딩 장치
10 10
제9항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 장치
11 11
제10항에 있어서,상기 임베딩 모델의 학습은상기 가중치 행렬을 학습시키는 것을 포함하는, 웹 문서 임베딩 장치
12 12
제9항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 장치
13 13
제8항에 있어서,상기 단어 임베딩부는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 장치
14 14
제8항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 장치
15 15
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 통신부; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 프로세서를 포함하는, 웹 문서 임베딩 장치
16 16
제15항에 있어서,상기 프로세서는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 벡터화하고, 벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는, 웹 문서 임베딩 장치
17 17
제16항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 장치
18 18
제17항에 있어서,상기 임베딩 모델의 학습은상기 가중치 행렬을 학습시키는 것을 포함하는, 웹 문서 임베딩 장치
19 19
제16항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 장치
20 20
제15항에 있어서,상기 단어 임베딩부는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 장치
21 21
제15항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 장치
22 22
웹 문서 임베딩을 수행하는 컴퓨터 프로그램을 저장한 컴퓨터 판독 가능한 저장 체로서, 상기 프로그램은 상기 컴퓨터가HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하도록 하는 명령; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하도록 하는 명령을 포함하는, 컴퓨터 프로그램을 저장한 컴퓨터 판독 가능한 저장 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 성균관대학교(자연과학캠퍼스) 차세대정보컴퓨팅기술개발사업 2단계 1/2 자가구성 기반 자율 기계학습 프레임워크 기초 원천 기술 개발
2 과학기술정보통신부 성균관대학교 산학협력단 인공지능핵심고급인재양성사업 1단계 1/3 인공지능대학원지원(성균관대학교)