맞춤기술찾기

이전대상기술

맥락 카테고리 데이터셋 생성 장치 및 방법

  • 기술번호 : KST2021011016
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 개시는 맥락 카테고리 데이터셋 생성 장치 및 방법을 제공한다. 본 개시의 일 측면에 의하면, 사용자가 입력한 해시태그가 속할 맥락 카테고리(context category)를 예측하고, 사용자로부터 해시태그가 속할 맥락 카테고리를 입력받아 맥락 카테고리 데이터셋을 생성 및 갱신하는 맥락 카테고리 데이터셋 생성 장치 및 방법을 제공한다.
Int. CL G06F 16/951 (2019.01.01) G06F 16/28 (2019.01.01) G06Q 50/00 (2018.01.01)
CPC
출원번호/일자 1020200143376 (2020.10.30)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2021-0114324 (2021.09.23) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200029339   |   2020.03.10
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.10.30)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김주호 대전광역시 유성구
2 김현우 대전광역시 유성구
3 고은영 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이철희 대한민국 서울특별시 강남구 도곡로**길 **(역삼동) 베리타스빌딩, *-*층(베리타스국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.10.30 수리 (Accepted) 1-1-2020-1159637-53
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.01.06 수리 (Accepted) 1-1-2021-0014850-72
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사용자 인터페이스(User Interface: UI)를 이용하여 맥락 카테고리 데이터셋(context category dataset)을 생성하는 장치에 있어서,맥락 카테고리(context category)별 해시태그 리스트(hashtag list)를 제공하는 리스트제공부; 및상기 해시태그 리스트를 기초로 상기 맥락 카테고리별로 생성된 단어 임베딩 벡터(word embedding vector)를 이용하여, 상기 사용자 인터페이스로부터 입력된 해시태그 정보(hashtag information)의 맥락 카테고리를 하나 이상 예측하는 카테고리예측부를 포함하되,상기 사용자 인터페이스는,예측된 맥락 카테고리를 사용자에게 제공하고, 상기 사용자로부터 맥락 카테고리 정보(context category information)를 입력받아 상기 리스트제공부에 제공하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성장치
2 2
제1항에 있어서,상기 단어 임베딩 벡터는,자신에 대응하는 맥락 카테고리의 기 정의된 임베딩 벡터 공간 상에서의 위치를 나타내는 벡터(vector)인 것을 특징으로 하는 맥락 카테고리 데이터셋 생성장치
3 3
제1항에 있어서,상기 리스트제공부는,상기 해시태그 정보 및 상기 맥락 카테고리 정보를 기초로, 새로운 맥락 카테고리의 해시태그 리스트를 생성하거나, 기존 맥락 카테고리의 해시태그 리스트를 갱신(update)함으로써 상기 해시태그 리스트를 생성 또는 갱신하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
4 4
제3항에 있어서,상기 리스트제공부는,상기 해시태그 정보를 단어별로 분류하는 전처리(preprocessing)를 수행한 후 상기 해시태그 리스트를 생성 또는 갱신하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
5 5
제1항에 있어서,상기 카테고리예측부는,상기 단어 임베딩 벡터를 생성 또는 갱신하는 벡터제공부; 및상기 단어 임베딩 벡터를 이용하여 상기 해시태그 정보가 상기 맥락 카테고리에 속할 확률을 각각 연산하여 상기 해시태그 정보가 속할 맥락 카테고리를 하나 이상 예측하는 예측부를 포함하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
6 6
제5항에 있어서,상기 벡터제공부에 의한 상기 단어 임베딩 벡터 생성은,상기 해시태그 리스트에 기 설정된 하나 이상의 기초 태그를 기초로, 상기 기초 태그의 임베딩 벡터로 구성된 클러스터(cluster)의 중심(centroid)을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 설정(assign)함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
7 7
제5항에 있어서,상기 벡터제공부에 의한 상기 단어 임베딩 벡터 갱신은,상기 해시태그 리스트에 원소의 추가가 있는 경우 추가된 원소의 임베딩 벡터를 더 고려하여, 상기 해시태그 리스트에 포함된 원소의 임베딩 벡터로 구성된 클러스터(cluster)의 중심을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 재설정(reassign)함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
8 8
제7항에 있어서,상기 재설정은,상기 해시태그 리스트에 추가된 해시태그의 수가 기 설정된 개수가 되는 경우마다 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
9 9
제5항에 있어서,상기 예측부는,상기 해시태그 정보의 임베딩 벡터를 각각 생성하여, 상기 단어 임베딩 벡터 각각과의 거리(distance)를 연산함으로써 상기 해시태그 정보가 상기 맥락 카테고리 각각에 속할 확률을 연산하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
10 10
제9항에 있어서,상기 해시태그 정보의 임베딩 벡터는,상기 해시태그 정보로부터 임베딩 벡터를 추출함으로써 생성되고, 상기 해시태그 정보로부터 임베딩 벡터를 추출할 수 없는 경우 상기 해시태그 정보를 단어별로 분류하여 각 단어의 임베딩 벡터를 합 연산함으로써 생성되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
11 11
제9항에 있어서,상기 예측부는,상기 해시태그 정보의 임베딩 벡터와 상기 단어 임베딩 벡터 각각과의 거리가 기 설정된 임계치 이상인 맥락 카테고리의 전부 또는 일부를 상기 해시태그의 맥락 카테고리로서 예측하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 장치
12 12
맥락 카테고리(context category)별 해시태그 리스트(hashtag list)를 기초로 상기 맥락 카테고리별로 단어 임베팅 벡터(word embedding vector)를 생성하는 과정;사용자 인터페이스(User Interface: UI)로부터 해시태그 정보(hashtag information)를 입력받는 과정;상기 단어 임베딩 벡터를 이용하여, 상기 해시태그 정보의 맥락 카테고리를 하나 이상 예측하는 과정;사용자에게 예측된 맥락 카테고리를 상기 사용자 인터페이스를 통해 제공하는 과정;상기 사용자로부터 맥락 카테고리 정보(context category information)를 입력받는 과정; 및상기 맥락 카테고리 정보를 기초로 상기 해시태그 리스트를 새로이 생성 또는 갱신(update)하는 과정을 포함하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
13 13
제12항에 있어서,상기 단어 임베팅 벡터를 생성하는 과정은,상기 해시태그 리스트에 포함된 원소의 임베딩 벡터로 구성된 클러스터(cluster)의 중심(centroid)을 대응하는 맥락 카테고리의 단어 임베딩 벡터로 설정(assign)하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
14 14
제12항에 있어서,상기 맥락 카테고리를 하나 이상 예측하는 과정은,상기 해시태그 정보의 임베딩 벡터를 생성하여 상기 단어 임베딩 벡터 각각과의 거리(distance)를 연산한 것을 기초로 예측하는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
15 15
제14항에 있어서,상기 예측은,상기 단어 임베딩 벡터 각각과의 거리를 대응하는 맥락 카테고리별로 정규화(normalize)하여 상기 해시태그 정보가 상기 맥락 카테고리 각각에 속할 확률을 연산하고, 연산한 확률이 높은 상위 N 개(N은 1 이상의 자연수)의 맥락 카테고리를 선정함으로써 수행되는 것을 특징으로 하는 맥락 카테고리 데이터셋 생성 방법
16 16
제12항 내지 제15항 중 어느 한 항에 따른 맥락 카테고리 데이터셋 생성 방법이 포함하는 각 과정을 실행시키기 위하여 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 차세대정보컴퓨팅기술개발사업 크라우드소싱 기반 컨텍스트 빅 데이터 수집 기술 개발 및 대규모 공개 데이터셋 구축