1 |
1
사용자 인터페이스(User Interface: UI)를 이용하여 맥락 카테고리 데이터셋(context category dataset)을 생성하는 장치에 있어서,맥락 카테고리(context category)별 해시태그 리스트(hashtag list)를 제공하는 리스트제공부; 및상기 해시태그 리스트를 기초로 상기 맥락 카테고리별로 생성된 단어 임베딩 벡터(word embedding vector)를 이용하여, 상기 사용자 인터페이스로부터 입력된 해시태그 정보(hashtag information)의 맥락 카테고리를 하나 이상 예측하는 카테고리예측부를 포함하되,상기 사용자 인터페이스는,예측된 맥락 카테고리를 사용자에게 제공하고, 상기 사용자로부터 맥락 카테고리 정보(context category information)를 입력받아 상기 리스트제공부에 제공하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성장치
|
2 |
2
제1항에 있어서,상기 단어 임베딩 벡터는,자신에 대응하는 맥락 카테고리의 기 정의된 임베딩 벡터 공간 상에서의 위치를 나타내는 벡터(vector)인 것을 특징으로 하는 맥락 카테고리 데이터셋 생성장치
|
3 |
3
제1항에 있어서,상기 리스트제공부는,상기 해시태그 정보 및 상기 맥락 카테고리 정보를 기초로, 새로운 맥락 카테고리의 해시태그 리스트를 생성하거나, 기존 맥락 카테고리의 해시태그 리스트를 갱신(update)함으로써 상기 해시태그 리스트를 생성 또는 갱신하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
4 |
4
제3항에 있어서,상기 리스트제공부는,상기 해시태그 정보를 단어별로 분류하는 전처리(preprocessing)를 수행한 후 상기 해시태그 리스트를 생성 또는 갱신하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
5 |
5
제1항에 있어서,상기 카테고리예측부는,상기 단어 임베딩 벡터를 생성 또는 갱신하는 벡터제공부; 및상기 단어 임베딩 벡터를 이용하여 상기 해시태그 정보가 상기 맥락 카테고리에 속할 확률을 각각 연산하여 상기 해시태그 정보가 속할 맥락 카테고리를 하나 이상 예측하는 예측부를 포함하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
6 |
6
제5항에 있어서,상기 벡터제공부에 의한 상기 단어 임베딩 벡터 생성은,상기 해시태그 리스트에 기 설정된 하나 이상의 기초 태그를 기초로, 상기 기초 태그의 임베딩 벡터로 구성된 클러스터(cluster)의 중심(centroid)을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 설정(assign)함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
7 |
7
제5항에 있어서,상기 벡터제공부에 의한 상기 단어 임베딩 벡터 갱신은,상기 해시태그 리스트에 원소의 추가가 있는 경우 추가된 원소의 임베딩 벡터를 더 고려하여, 상기 해시태그 리스트에 포함된 원소의 임베딩 벡터로 구성된 클러스터(cluster)의 중심을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 재설정(reassign)함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
8 |
8
제7항에 있어서,상기 재설정은,상기 해시태그 리스트에 추가된 해시태그의 수가 기 설정된 개수가 되는 경우마다 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
9 |
9
제5항에 있어서,상기 예측부는,상기 해시태그 정보의 임베딩 벡터를 각각 생성하여, 상기 단어 임베딩 벡터 각각과의 거리(distance)를 연산함으로써 상기 해시태그 정보가 상기 맥락 카테고리 각각에 속할 확률을 연산하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
10 |
10
제9항에 있어서,상기 해시태그 정보의 임베딩 벡터는,상기 해시태그 정보로부터 임베딩 벡터를 추출함으로써 생성되고, 상기 해시태그 정보로부터 임베딩 벡터를 추출할 수 없는 경우 상기 해시태그 정보를 단어별로 분류하여 각 단어의 임베딩 벡터를 합 연산함으로써 생성되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
11 |
11
제9항에 있어서,상기 예측부는,상기 해시태그 정보의 임베딩 벡터와 상기 단어 임베딩 벡터 각각과의 거리가 기 설정된 임계치 이상인 맥락 카테고리의 전부 또는 일부를 상기 해시태그의 맥락 카테고리로서 예측하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
|
12 |
12
맥락 카테고리(context category)별 해시태그 리스트(hashtag list)를 기초로 상기 맥락 카테고리별로 단어 임베팅 벡터(word embedding vector)를 생성하는 과정;사용자 인터페이스(User Interface: UI)로부터 해시태그 정보(hashtag information)를 입력받는 과정;상기 단어 임베딩 벡터를 이용하여, 상기 해시태그 정보의 맥락 카테고리를 하나 이상 예측하는 과정;사용자에게 예측된 맥락 카테고리를 상기 사용자 인터페이스를 통해 제공하는 과정;상기 사용자로부터 맥락 카테고리 정보(context category information)를 입력받는 과정; 및상기 맥락 카테고리 정보를 기초로 상기 해시태그 리스트를 새로이 생성 또는 갱신(update)하는 과정을 포함하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
|
13 |
13
제12항에 있어서,상기 단어 임베팅 벡터를 생성하는 과정은,상기 해시태그 리스트에 포함된 원소의 임베딩 벡터로 구성된 클러스터(cluster)의 중심(centroid)을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 설정(assign)하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
|
14 |
14
제12항에 있어서,상기 맥락 카테고리를 하나 이상 예측하는 과정은,상기 해시태그 정보의 임베딩 벡터를 생성하여 상기 단어 임베딩 벡터 각각과의 거리(distance)를 연산한 것을 기초로 예측하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
|
15 |
15
제14항에 있어서,상기 예측은,상기 단어 임베딩 벡터 각각과의 거리를 대응하는 맥락 카테고리별로 정규화(normalize)하여 상기 해시태그 정보가 상기 맥락 카테고리 각각에 속할 확률을 연산하고, 연산한 확률이 높은 상위 N 개(N은 1 이상의 자연수)의 맥락 카테고리를 선정함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
|
16 |
16
제12항 내지 제15항 중 어느 한 항에 따른 맥락 카테고리 데이터셋 생성 방법이 포함하는 각 과정을 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램
|