1 |
1
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 단계; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 단계를 포함하는, 웹 문서 임베딩 방법
|
2 |
2
제1항에 있어서,상기 단어 임베딩을 수행하는 단계는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 각각 벡터화하는 단계; 및벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는 단계를 포함하는, 웹 문서 임베딩 방법
|
3 |
3
제2항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 방법
|
4 |
4
제3항에 있어서,상기 임베딩 모델을 학습시키는 단계는상기 가중치 행렬을 학습시키는 단계를 포함하는, 웹 문서 임베딩 방법
|
5 |
5
제2항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 방법
|
6 |
6
제1항에 있어서,상기 단어 임베딩을 수행하는 단계는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 방법
|
7 |
7
제1항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 방법
|
8 |
8
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 웹 문서 수집부; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 단어 임베딩부를 포함하는, 웹 문서 임베딩 장치
|
9 |
9
제8항에 있어서,상기 단어 임베딩부는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 벡터화하고, 벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는, 웹 문서 임베딩 장치
|
10 |
10
제9항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 장치
|
11 |
11
제10항에 있어서,상기 임베딩 모델의 학습은상기 가중치 행렬을 학습시키는 것을 포함하는, 웹 문서 임베딩 장치
|
12 |
12
제9항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 장치
|
13 |
13
제8항에 있어서,상기 단어 임베딩부는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 장치
|
14 |
14
제8항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 장치
|
15 |
15
HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하는 통신부; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하는 프로세서를 포함하는, 웹 문서 임베딩 장치
|
16 |
16
제15항에 있어서,상기 프로세서는상기 웹 문서 데이터에 포함된 텍스트 및 HTML 태그 정보를 벡터화하고, 벡터화된 상기 텍스트 및 상기 HTML 태그 정보를 입력으로 하여 임베딩 모델을 학습시키는, 웹 문서 임베딩 장치
|
17 |
17
제16항에 있어서,상기 임베딩 모델은벡터화된 상기 HTML 태그 정보의 가중치 행렬을 포함하는, 웹 문서 임베딩 장치
|
18 |
18
제17항에 있어서,상기 임베딩 모델의 학습은상기 가중치 행렬을 학습시키는 것을 포함하는, 웹 문서 임베딩 장치
|
19 |
19
제16항에 있어서,벡터화된 상기 HTML 태그 정보는 원-핫(one-hot) 벡터인, 웹 문서 임베딩 장치
|
20 |
20
제15항에 있어서,상기 단어 임베딩부는 word2vec에 의해 단어 임베딩을 수행하는, 웹 문서 임베딩 장치
|
21 |
21
제15항에 있어서,상기 HTML 태그 정보는003c#html003e#, 003c#head003e#, 003c#body003e#, 003c#h1003e#, 003c#h2003e#, 003c#h3003e#, 003c#h4003e#, 003c#h5003e#, 003c#h6003e#, 003c#bold003e#, 003c#strong003e#, 003c#u003e#, 003c#br003e#, 003c#p003e#, 003c#li003e#, 003c#ul003e#, 및 003c#a003e# 중 적어도 하나를 포함하는, 웹 문서 임베딩 장치
|
22 |
22
웹 문서 임베딩을 수행하는 컴퓨터 프로그램을 저장한 컴퓨터 판독 가능한 저장 체로서, 상기 프로그램은 상기 컴퓨터가HTML(Hypertext Markup Language) 태그(tag) 정보를 포함한 웹(web) 문서 데이터를 수집하도록 하는 명령; 및상기 HTML 태그 정보를 이용하여 단어 임베딩(word embedding)을 수행하도록 하는 명령을 포함하는, 컴퓨터 프로그램을 저장한 컴퓨터 판독 가능한 저장 매체
|