1 |
1
엔터티에 관련된 웹 페이지들을 수집하는 단계;상기 웹 페이지들 각각에 대응하여, 상기 웹 페이지들의 집합에서 해당 웹 페이지에 포함된 적어도 하나의 단어의 중요도, 및 상기 웹 페이지들 중 해당 단어를 포함하는 웹 페이지의 정규화된 빈도수에 따라 해당 웹 페이지 특징들을 추출하는 단계;상기 웹 페이지들의 특징들에 기초하여, 상기 웹 페이지들이 상기 엔터티와 관련된 정도를 지시하는 빈도수들을 결정하는 단계;상기 웹 페이지들의 빈도수들에 기초하여, 상기 웹 페이지들을 상기 엔터티에 대한 관련성 데이터 및 비관련성 데이터로 분류하는 단계; 및상기 분류 결과 및 상기 특징들을 이용하여 학습 데이터 세트를 생성하는 단계를 포함하는,딥러닝 기반 정보 분류 방법
|
2 |
2
제1항에 있어서,상기 웹 페이지들을 수집하는 단계는,상기 엔터티에 대한 속성들을 활용하여 조합 가능한 적어도 하나의 질의를 생성하는 단계; 및웹 검색 엔진을 통하여 상기 적어도 하나의 질의에 대한 상기 웹 페이지들을 수집하는 단계를 포함하는,딥러닝 기반 정보 분류 방법
|
3 |
3
제1항에 있어서,상기 엔터티와의 관련성 데이터 및 비관련성 데이터로 분류하는 단계는,상기 웹 페이지들의 빈도수 분포를 활용하여 기준 이상의 빈도수가 발생하는 웹 페이지들을 상기 관련성 데이터로 분류하고, 상기 기준 미만의 빈도수가 발생하는 웹 페이지들은 상기 비관련성 데이터로 분류하는 단계를 포함하는,딥러닝 기반 정보 분류 방법
|
4 |
4
제1항에 있어서,상기 해당 웹 페이지의 특징들을 추출하는 단계는,상기 해당 웹 페이지에 포함된 단어들을 하기 수학식에 대입하여 상기 엔터티와의 관련성을 계산하는 단계; 및상기 관련성이 계산된 단어들 중 상기 계산된 값이 높은 단어들을 미리 정해진 기준에 따라 상기 특징으로 추출하는 단계를 포함하는,딥러닝 기반 정보 분류 방법
|
5 |
5
제1항에 있어서,상기 학습 데이터 세트에 기초하여 정보 분류 모델을 학습하는 단계;상기 학습된 정보 분류 모델에 기초하여 상기 웹 페이지들을 분류하는 단계; 및상기 정보 분류 모델 및 상기 학습 데이터 세트를 제공하는 단계를 더 포함하는,딥러닝 기반 정보 분류 방법
|
6 |
6
제5항에 있어서,상기 학습된 정보 분류 모델에 기초하여 상기 웹 페이지들을 분류하는 단계는,상기 웹 페이지들에 대해 상기 엔터티와 관련성을 분류하는 단계를 포함하는,딥러닝 기반 정보 분류 방법
|
7 |
7
하드웨어와 결합되어 제1항 내지 제6항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
8 |
8
딥러닝 기반 정보 분류를 위한 장치에 있어서,하나 이상의 프로세서;메모리; 및상기 메모리에 저장되어 있으며 상기 하나 이상의 프로세서에 의하여 실행되도록 구성되는 하나 이상의 프로그램을 포함하고,상기 프로그램은,엔터티에 관련된 웹 페이지들을 수집하는 단계;상기 웹 페이지들 각각에 대응하여, 상기 웹 페이지들의 집합에서 해당 웹 페이지에 포함된 적어도 하나의 단어의 중요도, 및 상기 웹 페이지들 중 해당 단어를 포함하는 웹 페이지의 정규화된 빈도수에 따라 해당 웹 페이지 특징들을 추출하는 단계;상기 웹 페이지들의 특징들에 기초하여, 상기 웹 페이지들이 상기 엔터티와 관련된 정도를 지시하는 빈도수들을 결정하는 단계;상기 웹 페이지들의 빈도수들에 기초하여, 상기 웹 페이지들을 상기 엔터티에 대한 관련성 데이터 및 비관련성 데이터로 분류하는 단계; 및상기 분류 결과 및 상기 특징들을 이용하여 학습 데이터 세트를 생성하는 단계를 포함하는,장치
|
9 |
9
제8항에 있어서,상기 웹 페이지들을 수집하는 단계는,상기 엔터티에 대한 속성들을 활용하여 조합 가능한 적어도 하나의 질의를 생성하는 단계; 및웹 검색 엔진을 통하여 상기 적어도 하나의 질의에 대한 상기 웹 페이지들을 수집하는 단계를 수행하는,장치
|
10 |
10
제8항에 있어서,상기 엔터티와의 관련성 데이터 및 비관련성 데이터로 분류하는 단계는,상기 웹 페이지들의 빈도수 분포를 활용하여 기준 이상의 빈도수가 발생하는 웹 페이지들을 상기 관련성 데이터로 분류하고, 상기 기준 미만의 빈도수가 발생하는 웹 페이지들은 상기 비관련성 데이터로 분류하는 단계를 수행하는,장치
|
11 |
11
제8항에 있어서,상기 해당 웹 페이지의 특징들을 추출하는 단계는,상기 해당 웹 페이지에 포함된 단어들을 하기 수학식에 대입하여 상기 엔터티와의 관련성을 계산하는 단계; 및상기 관련성이 계산된 단어들 중 상기 계산된 값이 높은 단어들을 미리 정해진 기준에 따라 상기 특징으로 추출하는 단계를 수행하는,장치
|
12 |
12
제8항에 있어서,상기 학습 데이터 세트에 기초하여 정보 분류 모델을 학습하는 단계;상기 학습된 정보 분류 모델에 기초하여 상기 웹 페이지들을 분류하는 단계; 및상기 정보 분류 모델 및 상기 학습 데이터 세트를 제공하는 단계를 더 수행하는,장치
|
13 |
13
제12항에 있어서,상기 학습된 정보 분류 모델에 기초하여 상기 웹 페이지들을 분류하는 단계는,상기 웹 페이지들에 대해 상기 엔터티와 관련성을 분류하는 단계를 수행하는,장치
|