맞춤기술찾기

이전대상기술

의미와 문맥을 고려한 주제기반 문서 자동 분류 시스템

  • 기술번호 : KST2019012494
  • 담당센터 : 광주기술혁신센터
  • 전화번호 : 062-360-4654
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 의미와 문맥을 고려한 주제기반 문서 자동 분류 시스템에 관한 것으로서, 전처리부가 형태소 분석을 통해 입력받은 문서를 각 단어별로 분류하는 (a) 단계; 특징추출부가 분류된 단어와 인접한 위치의 다른 단어들을 의미별로 분류하는 (b) 단계; 특징추출부가 분류된 단어들의 문맥을 고려해 구성한 문장 또는 문서를 벡터화하는 (c) 단계; 및 자동분류부가 벡터화된 문장 또는 문서를 주제별로 분류하는 (d) 단계를 포함한다.상기와 같은 본 발명에 따르면, 다양한 문서 집합으로부터 형태소를 분석해 불용어 필터링하고, 문서의 벡터 변환과 특징을 추출하며, 순환신경망 기반으로 문서를 자동으로 분류함으로써, 문서에 포함된 단어의 의미와 문맥을 고려하여 서로 유사한 문서를 추출해 주제별로 분류하는 일련의 과정을 자동으로 수행할 수 있다.
Int. CL G06F 16/00 (2019.01.01)
CPC G06F 16/93(2013.01)G06F 16/93(2013.01)
출원번호/일자 1020180061050 (2018.05.29)
출원인 전남대학교산학협력단
등록번호/일자 10-1938212-0000 (2019.01.08)
공개번호/일자
공고번호/일자 (20190115) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.05.29)
심사청구항수 1

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 전남대학교산학협력단 대한민국 광주광역시 북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 양형정 광주광역시 남구
2 주종민 전라남도 담양군

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이은철 대한민국 서울특별시 송파구 법원로**길 **, A동 *층 ***호 (문정동, H비지니스파크)(*T국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 전남대학교산학협력단 광주광역시 북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.05.29 수리 (Accepted) 1-1-2018-0525904-08
2 [우선심사신청]심사청구(우선심사신청)서
[Request for Preferential Examination] Request for Examination (Request for Preferential Examination)
2018.05.31 수리 (Accepted) 1-1-2018-0535655-13
3 의견제출통지서
Notification of reason for refusal
2018.06.19 발송처리완료 (Completion of Transmission) 9-5-2018-0414897-31
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.07.13 수리 (Accepted) 1-1-2018-0693308-46
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.07.13 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0693307-01
6 거절결정서
Decision to Refuse a Patent
2018.10.31 발송처리완료 (Completion of Transmission) 9-5-2018-0739897-19
7 [명세서등 보정]보정서(재심사)
Amendment to Description, etc(Reexamination)
2018.11.22 보정승인 (Acceptance of amendment) 1-1-2018-1166365-45
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.11.22 수리 (Accepted) 1-1-2018-1166366-91
9 등록결정서
Decision to Grant Registration
2018.12.20 발송처리완료 (Completion of Transmission) 9-5-2018-0878148-12
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
형태소 분석을 통해 입력받은 문서를 각각의 단어로 분리하는 전처리부;분리된 단어와 인접한 위치의 다른 단어들을 의미별로 분류하고, 의미별로 분류된 단어들을 포함한 문장 또는 문서를 벡터화하는 특징추출부; 및상기 벡터화된 문장 또는 문서를 순환신경망 기반에 다층 구조의 서열 분류모델인 GRU(Gated Recurrent Unit)의 업데이트 게이트(update gate)와 리셋 게이트(reset gate)로 구성된 셀(cell)을 통해 주제별로 분류하는 자동분류부를 포함하되,상기 특징추출부는,문장 내에서 특정 단어가 입력 데이터로 설정되면 주위에 인접한 다른 단어를 출력 데이터로 입력하고, 스킵그램 모델(Skip-gram model)을 통해 학습을 수행하여 상기 특정 단어와 인접한 위치의 다른 단어들을 의미별로 분류하여 벡터로 설정하는 의미분석모듈; 및상기 의미별로 분류된 단어들을 분산메모리(DM: distributed memory) 구조를 통해 기 설정된 문맥 연결 기준에 부합하도록 구성한 문장 또는 문서를 벡터화하는 문맥파악모듈을 포함하고,상기 의미분석모듈은,상기 입력 데이터를 은닉층(Hidden layer)로 인가하고, 출력층(Output layer)에 입력된 데이터에 가중치 행렬(Weight Matrix)을 곱한 값을 인가하며, 소프트맥스(softmax) 계산을 통해 기 설정된 단어의 벡터와 비교하여 오차를 계산한 후 오류 역전파를 통한 수정을 반복해 가중치 행렬을 수정하고, 기 설정된 기준 이하의 오차가 나오는 경우 가중치 행렬을 곱한 값과 대응하는 단어들을 벡터로 설정하며, 상기 특정 단어와 인접한 위치의 다른 단어를 의미별로 분류하여 word2vec를 통해 벡터화하며,상기 문맥파악모듈은,학습 단계를 벡터에 기억시키고 학습된 최종 벡터를 해당 문서의 벡터로 정의하되, 문단(paragraph) 벡터 메모리를 추가로 할당하고, 학습단계에서 입력 벡터에 추가로 문서 벡터를 더해 분류하고, 학습한 결과만큼의 오차를 갱신하되, 상기 문장 또는 문서를 doc2vec을 통해 벡터화하며,상기 리셋 게이트는 [수학식 1]을 통해 정의하고, 상기 업데이트 게이트는 [수학식 2]를 통해서 정의하며, 현 시점에서 유지할 정보를 [수학식 3]과 같이 정의하고, 수정된 현재의 정보를 출력값으로 내보내기 위한 업데이트 절차는 [수학식 4]를 통해 수행하되, 현재의 정보는 로 설정하고, 과거 정보는 로 설정하며, 과거 정보를 얼마나 반열할지는 리셋 게이트 를 통해 결정하고, 과거의 정보 과 현재의 정보 를 업데이트 게이트 값을 통해 결정하는 것을 특징으로 하는 의미와 문맥을 고려한 주제기반 문서 자동 분류 시스템
2 2
삭제
3 3
삭제
4 4
삭제
5 5
삭제
6 6
삭제
7 7
삭제
8 8
삭제
9 9
삭제
10 10
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 전남대학교산학협력단 대학ICT연구센터육성지원사업 도시 재난재해 대응 ICT 융합 시스템 연구