맞춤기술찾기

이전대상기술

문서 구조와 딥러닝을 이용한 문서 분류 장치 및 방법

  • 기술번호 : KST2019033351
  • 담당센터 : 인천기술혁신센터
  • 전화번호 : 032-420-3580
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 문서 구조와 딥러닝을 이용한 문서 분류 장치 및 방법은 문서 분류 시 문서에 부여되는 가중치 적용 방식과, 이에 대응하는 복수의 분류기 중 분류 성능이 우수한 분류기와 가중치 적용 방식을 선택하여 텍스트를 분류한다. 문서 분류 시 문서에 부여되는 가중치 부여 방식과 이에 대응하는 지도 학습 기술을 F 측정값을 비교하고 가장 높은 측정값의 분류기를 선택하여 우수한 성능의 분류기를 적용할 수 있다.
Int. CL G06F 16/00 (2019.01.01) G06F 17/27 (2006.01.01) G06N 3/08 (2006.01.01)
CPC G06F 16/3347(2013.01) G06F 16/3347(2013.01) G06F 16/3347(2013.01) G06F 16/3347(2013.01)
출원번호/일자 1020180060185 (2018.05.28)
출원인 인천대학교 산학협력단
등록번호/일자
공개번호/일자 10-2019-0135129 (2019.12.06) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.05.28)
심사청구항수 3

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 인천대학교 산학협력단 대한민국 인천광역시 연수구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 전광길 인천광역시 연수구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인충정 대한민국 서울특별시 강남구 역삼로***,*층(역삼동,성보역삼빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 인천대학교 산학협력단 인천광역시 연수구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.05.28 수리 (Accepted) 1-1-2018-0518717-02
2 선행기술조사의뢰서
Request for Prior Art Search
2019.05.14 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2019.06.13 수리 (Accepted) 9-1-2019-0028273-15
4 의견제출통지서
Notification of reason for refusal
2019.06.19 발송처리완료 (Completion of Transmission) 9-5-2019-0438587-89
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2019.08.19 수리 (Accepted) 1-1-2019-0848106-56
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.09.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0953975-35
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.09.18 수리 (Accepted) 1-1-2019-0953974-90
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.14 수리 (Accepted) 4-1-2019-5212872-93
9 등록결정서
Decision to grant
2020.01.15 발송처리완료 (Completion of Transmission) 9-5-2020-0037535-90
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 하나의 문서를 포함하는 문서 데이터베이스부;상기 문서 데이터베이스부로부터 수신한 문서를 문자열로 변환하고, 전치사, 접속사, 대명사 등의 정보가 없는 단어를 제거하며, 동일한 개념적 의미를 가진 단어 그룹을 만드는 단어의 형태소 분석을 수행하는 전처리부;벡터 공간 모델을 이용한 인덱싱 처리를 수행하여 문서에 포함된 단어에 가중치 부여 방식에 의해 가중치를 부여하여 특징 벡터들의 특징 세트를 구성하는 특징 벡터 생성부; 및상기 특징 벡터 생성부로부터 구성된 특징 벡터들의 특징 세트를 수신하고, 상기 수신한 특징 세트를 결정 트리(Decision Tree), 나이브 베이즈(Naive Bayes), 서포트 벡터 머신(Support Vector Machine) 중 하나의 지도 학습 기술을 이용하여 텍스트를 분류하는 텍스트 분류기를 포함하며,상기 가중치 부여 방식은 Binary, TFIDF(Term Frequency Inverse Document Frequency), TFC(Term Frequency Collection), LTC(Length Term Collection), Entropy 중 하나의 방식을 적용하며,상기 텍스트 분류기에서 텍스트를 분류할 문서는 객체 지향 문서가 포함된 Gang-of-Four 문서 컬렉션, 시스템 관련 문서가 포함된 더글라스 문서 컬렉션, 기업 보안 및 리스크 관리 문서가 포함된 보안 문서 컬렉션으로 나누어지고,상기 텍스트 분류기는 상기 결정 트리, 상기 나이브 베이즈, 상기 서포트 벡터 머신의 각각에 대하여 상기 5개의 가중치 부여 방식마다 공지된 F-Measure 방법에 적용하여 F 측정값을 각각 계산하고, 상기 계산된 F 측정값이 가장 높은 가중치 부여 방식을 상기 특징 벡터 생성부의 가중치 부여 방식으로 선택하고, 상기 가장 높은 가중치 부여 방식과 이에 대응하는 지도 학습 기술을 통해 구성된 순위가 결정된 상위 n개의 특징 벡터들이 텍스트 분류 기술로 적용되며,상기 텍스트 분류기는 상기 더글라스 문서 컬렉션 및 상기 보안 문서 컬렉션의 경우, 상기 지도 학습 기술로 상기 서포트 벡터 머신을 적용하고, 상기 Gang-of-Four 문서 컬렉션 및 상기 더글라스 문서 컬렉션의 경우, 가중치 부여 방식으로 상기 TFIDF를 적용하는 것을 특징으로 하는 문서 구조와 딥러닝을 이용한 문서 분류 장치
2 2
삭제
3 3
제1항에 있어서,상기 특징 벡터 생성부는 상기 전처리부로부터 전처리된 문서를 입력받아 문서를 적절한 클래스로 분류하기 위하여 Deep Belief Network(DBN) 알고리즘을 이용하여 학습 데이터와 특징 벡터들의 특징 세트를 구성하는 것을 특징으로 하는 문서 구조와 딥러닝을 이용한 문서 분류 장치
4 4
제1항에 있어서,상기 F-Measure 방법은 하기의 수학식 1, 수학식 2, 수학식 3에 의해 F 측정값을 계산하는 것을 특징으로 하는 문서 구조와 딥러닝을 이용한 문서 분류 장치
5 5
삭제
6 6
삭제
7 7
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.