맞춤기술찾기

이전대상기술

텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템 및 방법

  • 기술번호 : KST2018012822
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 개별 문서를 다양한 매체의 관점에서 재분류하고 이러한 결과를 문서에 2차원 레이블로 저장함으로써, 이종 매체에 속한 다양한 문서들을 마치 한 매체에 속한 것과 같이 동일한 카테고리 기준으로 탐색할 수 있는 논리적 장치를 제안하여 기존 매체 고유의 카테고리 체계는 그대로 유지하면서 이종 매체 간 카테고리 매핑을 수행하는 시스템 및 방법을 제공하기 위한 것으로서, 이종 매체들로부터 문서를 수집한 후, 문서와 토픽 간의 대응도를 산출하여 수집된 문서들을 모두 통합하고, 토픽 모델링을 수행하여 각 문서를 구조화하는 토픽 모델링부와, 준지도 학습 기반의 문서 분류를 활용하여 상기 토픽 모델링부에서 구조화된 문서 중 기분류 문서에 대한 학습을 통해 생성된 분류 알고리즘을 이용하여 미분류 문서를 분류하여 기존의 기분류 문서와 통합된 1차 학습 데이터를 생성하는 1차 학습 및 분류부와, 상기 1차 학습 및 분류부를 통해 보강된 1차 학습 데이터를 활용하여 최종적인 대상 미분류 문서에 카테고리를 부여하여 2차 분류된 2차 학습 데이터를 생성하는 2차 학습 및 분류부를 포함하여 구성되는데 있다.
Int. CL G06F 17/30 (2006.01.01) G06F 15/18 (2018.01.01)
CPC G06F 16/41(2013.01) G06F 16/41(2013.01)
출원번호/일자 1020170031217 (2017.03.13)
출원인 국민대학교산학협력단
등록번호/일자
공개번호/일자 10-2018-0104446 (2018.09.21) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.03.13)
심사청구항수 14

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 국민대학교산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남규 대한민국 서울특별시 중랑구
2 김다솜 대한민국 서울특별시 성북구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 정부연 대한민국 서울특별시 서초구 반포대로**길 ** ***동 ***,***호(서초동, 한빛위너스)(현신특허사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 국민대학교산학협력단 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.03.13 수리 (Accepted) 1-1-2017-0247616-75
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2018.05.14 수리 (Accepted) 1-1-2018-0471367-89
3 의견제출통지서
Notification of reason for refusal
2018.06.21 발송처리완료 (Completion of Transmission) 9-5-2018-0421397-89
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.07.06 수리 (Accepted) 1-1-2018-0666944-31
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.07.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0666943-96
6 등록결정서
Decision to grant
2018.11.30 발송처리완료 (Completion of Transmission) 9-5-2018-0819200-83
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
자체적 혹은 고유적으로 운영하는 카테고리가 존재하는 분류의 기준이 되는 기준매체와 기준매체로부터 카테고리를 부여받는 분류의 대상이 되는 대상매체로 구성되는 이종 매체들로부터 문서를 수집한 후, 문서와 토픽 간의 대응도를 산출하여 수집된 문서들을 모두 통합하고, 토픽 모델링을 수행하여 각 문서를 구조화하는 토픽 모델링부와,준지도 학습 기반의 문서 분류를 활용하여 상기 토픽 모델링부에서 구조화된 문서 중 기분류 문서에 대한 학습을 통해 생성된 분류 알고리즘을 이용하여 미분류 문서를 분류하여 기존의 기분류 문서와 통합된 1차 학습 데이터를 생성하는 1차 학습 및 분류부와,상기 1차 학습 및 분류부를 통해 보강된 1차 학습 데이터를 활용하여 최종적인 대상 미분류 문서에 카테고리를 부여하여 2차 분류된 2차 학습 데이터를 생성하는 2차 학습 및 분류부를 포함하여 구성되는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
2 2
제 1 항에 있어서, 상기 이종 매체는 일반 웹 사이트, 포털 사이트, 언론, 소셜 미디어를 포함하는 문서를 제공하는 웹 플랫폼인 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
3 3
제 2 항에 있어서, 상기 이종 매체 중 기준매체는 분류에 사용될 카테고리 제공을 위하여 하나의 매체만 선정 가능하고,상기 이종 매체 중 대상매체는 고유의 카테고리 체계는 존재하거나 존재하지 않아도 되며, 복수 개의 매체가 선정 가능한 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
4 4
제 1 항에 있어서, 상기 토픽 모델링부는기준매체로부터 입력되는 기준소스(Base Source)를 저장하는 기준소스 DB와,대상매체로부터 입력되는 대상소스(Target Source)를 저장하는 대상소스 DB와, 상기 기준소스 DB에 저장된 기준소스로부터 추출한 모든 기분류 문서(Labeleed Documents)의 집합인 시드문서(Seed Documents)를 저장하는 시드문서 DB와,대상소스 DB에 저장된 대상소스로부터 추출한 미분류 문서(Unlabeled Document) 중 준지도 학습방법을 채택하기 위한 일부를 추출하여 보강된 미분류 문서로 저장하는 보강된 미분류 문서 DB와,대상소스 DB에 저장된 대상소스로부터 추출한 미분류 문서(Unlabeled Document) 중 상기 보강된 미분류 문서로 추출된 문서를 제외한 나머지 미분류 문서인 대상 미분류 문서를 저장하는 대상 미분류 문서 DB와,상기 시드문서 DB, 보강된 미분류 문서 DB 및 대상 미분류 문서 DB에 각각 수집되어 저장된 문서들(시드문서, 보강된 미분류 문서, 대상 미분류 문서)을 모두 통합하고, 토픽 모델링을 수행하여 각 문서를 구조화하는 문서 구조화부를 포함하여 구성되는 것을 특징하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
5 5
제 1 항에 있어서, 상기 1 차 학습 및 분류부는토픽 모델링부에서 구조화된 문서 중 시드문서 및 보강된 미분류 문서를 입력으로 각각 저장하는 구조화된 시드문서 DB와, 상기 구조화된 시드문서 DB에 저장된 소량의 기분류 시드문서에 대한 학습을 통해 분류 알고리즘을 생성하는 제 1 학습부와,상기 제 1 학습부에서 생성된 분류 알고리즘을 통해 분류 규칙을 생성하는 제 1 규칙 분류부와, 상기 제 1 규칙 분류부에서 생성된 규칙을 적용하여 보강된 미분류 문서를 분류하는 제 1 분류부를 포함하여 구성되는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
6 6
제 5 항에 있어서, 상기 제 1 학습부는 카테고리 분류 과정에 준지도 학습을 활용하여 학습하는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
7 7
제 1 항에 있어서, 상기 2차 학습 및 분류부는토픽 모델링부에서 구조화된 문서 중 보강된 미분류 문서와 상기 1차 학습 및 분류부에서 분류된 문서를 저장하는 구조화된 보강된 미분류 문서 DB와,상기 보강된 미분류 문서와 분류된 문서를 통합하여 저장하는 구조화된 보강된 기분류 문서 DB와,상기 구조화된 보강된 기분류 문서 DB에 저장된 통합 문서에 대한 학습을 통해 분류 알고리즘을 생성하는 제 2 학습부와,상기 제 2 학습부에서 생성된 분류 알고리즘을 통해 분류 규칙을 생성하는 제 2 규칙 분류부와,토픽 모델링부에서 구조화된 문서 중 구조화된 대상 미분류 문서 DB에 저장된 대상 미분류 문서의 구조화된 문서를 상기 제 2 규칙 분류부에서 생성된 분류 규칙을 적용하여 분류하여 최종 대상문서 DB에 저장하는 제 2 분류부를 포함하여 구성되는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 시스템
8 8
(A) 토픽 모델링부를 통해 자체적 혹은 고유적으로 운영하는 카테고리가 존재하는 분류의 기준이 되는 기준매체와 기준매체로부터 카테고리를 부여받는 분류의 대상이 되는 대상매체로 구성되는 이종 매체들로부터 문서를 수집한 후, 문서와 토픽 간의 대응도를 산출하여 수집된 문서들을 모두 통합하고, 토픽 모델링을 수행하여 각 문서를 구조화하는 단계와,(B) 1차 학습 및 분류부를 통해 준지도 학습 기반의 문서 분류를 활용하여 상기 토픽 모델링부에서 구조화된 문서 중 기분류 문서에 대한 학습을 통해 생성된 분류 알고리즘을 이용하여 미분류 문서를 분류하여 기존의 기분류 문서와 통합된 1차 학습 데이터를 생성하는 단계와,(C) 2차 학습 및 분류부를 통해 상기 생성된 1차 학습 데이터를 활용하여 최종적인 대상 미분류 문서에 카테고리를 부여하여 2차 분류된 2차 학습 데이터를 생성하는 단계를 포함하여 이루어지는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
9 9
제 8 항에 있어서, 상기 (A) 단계는(A1) 이종매체 중 기준매체로부터 기준소스를, 대상매체로부터 대상소스를 각각 입력받아 추출한 문서의 집합인 시드문서 및 미분류 문서를 저장하는 단계와,(A2) 상기 저장된 미분류 문서의 일부를 추출하여 보강된 미분류 문서로 저장하는 단계와,(A3) 문서 구조화부를 통해 저장된 시드문서, 보강된 미분류 문서, 대상 미분류 문서를 모두 통합하고, 토픽 모델링을 수행하여 각 문서를 구조화하는 단계를 포함하여 이루어지는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
10 10
제 9 항에 있어서, 상기 기준소스는 이미 고유의 카테고리 체계를 갖고 있는 기분류 문서이며,상기 대상소스는 상기 기준소스의 관점에서 새로운 카테고리를 부여받게 되는 미분류 문서인 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
11 11
제 9 항에 있어서, 상기 (A3) 단계는문서 구조화부를 통해 저장된 시드문서, 보강된 미분류 문서, 대상 미분류 문서를 모두 통합하는 단계와,상기 통합된 문서를 용어의 빈도에 기반을 두어 용어에 대한 차원의 수(토픽의 수)를 축소하는 단계와,상기 축소된 각 용어가 토픽에 대응되는 정도인 용어 가중치를 산출하는 단계와,상기 산출된 용어 가중치가 미리 정해진 용어 임계값 이상인 경우 해당 토픽을 나타내는 용어로 설정하는 단계와,각 문서를 각 토픽에 대응되는 정도인 문서 가중치의 벡터로 나타냄으로서, 문서를 구조적 형태로 표현하는 단계를 포함하여 이루어지는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
12 12
제 11 항에 있어서, 상기 (B) 단계는 문서 가중치 벡터를 입력 변수로 카테고리를 목적 변수로 설정하여 구조적 형태로 표현된 문서의 분류를 위한 학습 및 분류를 수행하는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
13 13
제 8 항에 있어서, 상기 (B) 단계는제 1 학습부를 통해 구조화된 문서 중 일부가 추출된 보강된 미분류 문서에 대한 준지도 학습을 활용하여 분류 알고리즘을 생성하는 단계와,상기 생성된 분류 알고리즘을 통해 제 1 규칙 분류부에서 분류 규칙을 생성하는 단계와,상기 생성된 분류 규칙을 적용하여 제 1 분류부에서 보강된 미분류 문서를 분류하여 기존의 기분류 문서와 통합된 1차 학습 데이터를 생성하는 단계를 포함하여 이루어지는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
14 14
제 8 항에 있어서, 상기 (C) 단계는제 2 학습부를 통해 상기 생성된 1차 학습 데이터에 대한 준지도 학습을 활용하여 분류 알고리즘을 생성하는 단계와,상기 생성된 분류 알고리즘을 통해 제 2 규칙 분류부에서 분류 규칙을 생성하는 단계와,상기 구조화된 문서 중 대상소스를 입력받아 추출한 미분류 문서에서 (B) 단계에서 보강된 미분류 문서로 추출된 문서를 제외한 나머지 미분류 문서를 상기 생성된 분류 규칙을 적용하여 분류하여 최종 대상문서인 2차 학습 데이터를 생성하는 단계를 포함하여 이루어지는 것을 특징으로 하는 텍스트 분석을 통한 이종 매체 카테고리 다중 매핑 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.