맞춤기술찾기

이전대상기술

문서를 매트릭스로 표현하는 방법

  • 기술번호 : KST2015194993
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 실시예에 따른 프로세서 및 상기 프로세서에 의해 실행되는 명령어들을 저장하는 메모리를 포함하는 전자 디바이스에서 문서를 매트릭스(matrix)로 표현하는 방법은, 상기 문서 내의 적어도 하나의 단어를 포함하는 단어 벡터(term vector)를 생성하는 단계, 상기 적어도 하나의 단어가 상기 문서 내에서 갖는 의미인 개념(concept)에 대하여, 상기 적어도 하나의 단어가 적어도 하나의 개념에 대하여 갖는 강도(weight)를 상기 적어도 하나의 개념마다 각각 산출하는 단계 및 상기 문서가 포함하는 상기 적어도 하나의 단어를 상기 매트릭스의 행(row)과 열(column) 중 어느 하나에 맵핑(mapping)하고, 상기 적어도 하나의 개념을 상기 매트릭스의 행과 열 중 다른 하나에 맵핑하여, 상기 문서를 상기 매트릭스로 표현하는 단계를 포함하며, 상기 매트릭스는 상기 적어도 하나의 단어가 상기 문서 내에서 상기 적어도 하나의 개념마다 갖는 강도를 구성요소로 포함할 수 있다.
Int. CL G06F 17/21 (2006.01)
CPC
출원번호/일자 1020140078416 (2014.06.25)
출원인 서울시립대학교 산학협력단
등록번호/일자 10-1494795-0000 (2015.02.12)
공개번호/일자
공고번호/일자 (20150223) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.06.25)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김한준 대한민국 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.06.25 수리 (Accepted) 1-1-2014-0597686-11
2 등록결정서
Decision to grant
2015.01.29 발송처리완료 (Completion of Transmission) 9-5-2015-0068677-17
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.17 수리 (Accepted) 4-1-2017-5009116-18
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.09.10 수리 (Accepted) 4-1-2019-5191631-69
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
프로세서 및 상기 프로세서에 의해 실행되는 명령어들을 저장하는 메모리를 포함하는 전자 디바이스에서 문서를 매트릭스(matrix)로 표현하는 방법으로써,상기 문서 내의 적어도 하나의 단어를 포함하는 단어 벡터(term vector)를 생성하는 단계;상기 적어도 하나의 단어가 상기 문서 내에서 갖는 의미인 개념(concept)에 대하여, 상기 적어도 하나의 단어가 적어도 하나의 개념에 대하여 갖는 강도(weight)를 상기 적어도 하나의 개념마다 각각 산출하는 단계; 및상기 문서가 포함하는 상기 적어도 하나의 단어를 상기 매트릭스의 행(row)과 열(column) 중 어느 하나에 맵핑(mapping)하고, 상기 적어도 하나의 개념을 상기 매트릭스의 행과 열 중 다른 하나에 맵핑하여, 상기 문서를 상기 매트릭스로 표현하는 단계를 포함하며,상기 매트릭스는, 상기 적어도 하나의 단어가 상기 문서 내에서 상기 적어도 하나의 개념마다 갖는 강도를 구성요소로 포함하는문서를 매트릭스로 표현하는 방법
2 2
제 1 항에 있어서,상기 적어도 하나의 개념을 포함하는 개념 공간(concept space)을 생성하는 단계를 더 포함하는문서를 매트릭스로 표현하는 방법
3 3
제 2 항에 있어서,상기 개념 공간은,온톨로지(ontology)를 이용하여 생성되는문서를 매트릭스로 표현하는 방법
4 4
제 3 항에 있어서,상기 개념에는,온라인 백과사전을 구성하는 웹페이지가 할당되는문서를 매트릭스로 표현하는 방법
5 5
제 4 항에 있어서,상기 개념에 상기 웹페이지가 할당됨에 있어서,상기 웹페이지의 페이지 분량, 백링크(backlink) 갯수 또는 상기 웹페이지의 제목(title)에 특수문자가 포함되었는지 여부 중 적어도 하나를 기초로 상기 웹페이지가 상기 개념으로 할당될지 여부가 결정되는문서를 매트릭스로 표현하는 방법
6 6
제 4 항에 있어서,상기 개념은,상기 개념에 할당된 상기 웹페이지에 포함된 단어에 tf*idf((Term Frequency * Inverse Document Frequency) 방법을 적용하여 산출된 적어도 하나의 키워드를 포함하는문서를 매트릭스로 표현하는 방법
7 7
제 1 항에 있어서,상기 적어도 하나의 단어가 상기 적어도 하나의 개념 각각에 대하여 갖는 강도를 포함하는 개념 벡터(concept vector)를 생성하는 단계를 더 포함하며,상기 개념 벡터는 상기 단어 벡터에 포함된 상기 적어도 하나의 단어마다 생성되는문서를 매트릭스로 표현하는 방법
8 8
제 1 항에 있어서,상기 강도는,상기 적어도 하나의 단어의 상기 적어도 하나의 개념 각각에 대한 근접성을 정량적으로 나타내는문서를 매트릭스로 표현하는 방법
9 9
제 7 항에 있어서,상기 단어 벡터에 포함된 상기 적어도 하나의 단어 중 제1 단어에 대한 상기 개념 벡터를 생성하는 단계는,상기 제1 단어를 중심 단어(center word)로 설정하는 단계;상기 제1 단어를 기준으로 상기 단어 벡터에서 기 지정된 반경(radius) 내에 있는 단어를 주변 단어로 설정하는 단계;상기 제1 단어와 상기 주변 단어 각각이 상기 적어도 하나의 개념 각각에 포함되는지 여부를 상기 적어도 하나의 개념마다 각각 판단하는 단계; 및상기 판단하는 단계에서 판단한 결과를 기초로, 상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계를 포함하는문서를 매트릭스로 표현하는 방법
10 10
제 9 항에 있어서,상기 적어도 하나의 개념 각각은,해당 개념을 나타내는 적어도 하나의 키워드를 포함하는문서를 매트릭스로 표현하는 방법
11 11
제 10 항에 있어서,상기 제1 단어와 상기 주변 단어 각각이 상기 적어도 하나의 개념 각각에 포함되는지 여부를 상기 적어도 하나의 개념마다 각각 판단하는 단계는,상기 제1 단어와 상기 주변 단어 각각이, 상기 적어도 하나의 개념이 포함하는 상기 적어도 하나의 키워드 중 적어도 하나와 일치하는지 여부에 기초하여, 상기 적어도 하나의 개념마다 각각 판단하는문서를 매트릭스로 표현하는 방법
12 12
제 9 항에 있어서,상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계는,상기 제1 단어와 상기 주변 단어 각각이 상기 개념에 포함되면 해당 단어의 상기 개념에 숫자 '1'을 할당하고 포함되지 않으면 숫자 '0'을 할당하며,상기 할당된 숫자를 상기 적어도 하나의 개념마다 각각 합산한 값을 상기 제1 단어의 상기 개념에 대한 강도로 산출하는문서를 매트릭스로 표현하는 방법
13 13
제 12 항에 있어서,상기 제1 단어의 상기 적어도 하나의 개념 각각에 대한 강도를 산출하는 단계에서,상기 합산한 값을 상기 제1 단어 및 상기 주변 단어의 갯수로 나눈 값을 상기 강도로 산출하는문서를 매트릭스로 표현하는 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20160004701 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2016004701 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 서울시립대학교 중견연구자지원 시멘틱 텍스트 큐보이드 기반 대용량 텍스트마이닝 프레임워크의 연구