맞춤기술찾기

이전대상기술

기계 학습을 이용한 텍스트 분류 방법 및 장치

  • 기술번호 : KST2019031121
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 기계 학습을 이용한 텍스트 분류 방법 및 장치가 개시된다. 기계 학습을 이용한 텍스트 분류 방법은 (a) 텍스트를 수집하는 단계; (b) 상기 수집된 각 텍스트를 워드 단위와 문자 단위로 각각 구분하는 단계; (c) 상기 워드 단위로 구분된 텍스트를 워드 기반 임베딩하여 벡터값으로 변환하는 단계; (d) 상기 문자 단위로 구분된 텍스트를 문자 기반 임베딩하여 벡터값으로 변환하는 단계; 및 (e) 상기 워드 기반 임베딩된 실수 벡터값과 상기 문자 기반 임베딩된 벡터값을 각각의 채널을 통해 학습된 텍스트 분류 모델에 적용하여 상기 텍스트의 분류 결과를 출력하는 단계를 포함한다.
Int. CL G06F 16/00 (2019.01.01) G06N 99/00 (2019.01.01)
CPC G06F 16/3347(2013.01) G06F 16/3347(2013.01)
출원번호/일자 1020180044121 (2018.04.16)
출원인 한양대학교 산학협력단
등록번호/일자 10-2015218-0000 (2019.08.21)
공개번호/일자
공고번호/일자 (20191021) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.04.16)
심사청구항수 9

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김종우 경기도 용인시 수지구
2 김건우 경기도 용인시 처인구
3 이주원 서울특별시 동대문구
4 장정연 경기도 군포시 용호*로**번길 **, *
5 김기태 충청남도 보령시 보령북로 *
6 여운영 서울특별시 성동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 최관락 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)
2 송인호 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한양대학교 산학협력단 대한민국 서울특별시 성동구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.04.16 수리 (Accepted) 1-1-2018-0377505-11
2 선행기술조사의뢰서
Request for Prior Art Search
2019.04.12 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2019.05.14 수리 (Accepted) 9-1-2019-0022411-80
4 의견제출통지서
Notification of reason for refusal
2019.05.22 발송처리완료 (Completion of Transmission) 9-5-2019-0367155-25
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.06.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0627001-99
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.06.19 수리 (Accepted) 1-1-2019-0627000-43
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.05 수리 (Accepted) 4-1-2019-5155816-75
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.06 수리 (Accepted) 4-1-2019-5156285-09
9 등록결정서
Decision to grant
2019.08.08 발송처리완료 (Completion of Transmission) 9-5-2019-0572644-04
10 [명세서등 보정]보정서(심사관 직권보정)
2019.09.23 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-5029954-42
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 텍스트를 수집하는 단계;(b) 상기 수집된 각 텍스트를 워드 단위와 문자 단위로 각각 구분하는 단계;(c) 상기 워드 단위로 구분된 텍스트를 워드 기반 임베딩하여 벡터값으로 변환하는 단계;(d) 상기 문자 단위로 구분된 텍스트를 문자 기반 임베딩하여 벡터값으로 변환하는 단계; 및(e) 상기 워드 기반 임베딩된 실수 벡터값과 상기 문자 기반 임베딩된 벡터값을 각각의 채널을 통해 학습된 텍스트 분류 모델에 적용하여 상기 텍스트의 분류 결과를 출력하는 단계를 포함하되,상기 학습된 텍스트 분류 모델은, 텍스트에 상응하여 워드 기반 임베딩된 벡터값과 문자 기반 임베딩된 벡터값을 텍스트 분류 모델부에 입력값으로 입력한 후 분류 결과를 설정하여 텍스트 분류 모델부의 내부 가중치를 조정하도록 하여 트레이닝되는 것을 특징으로 하는 텍스트 분류 방법
2 2
제1 항에 있어서, 상기 텍스트 분류 모델은, 복수의 채널을 통해, 워드 기반 임베딩된 실수 벡터값과 상기 문자 기반 임베딩된 벡터값을 각각 입력받고, 각 필터 사이즈에 대해 합성곱을 수행하여 출력값을 출력하며, 맥스풀링을 통해 상기 각 필터 사이즈에서 출력된 출력값들 중 최대값을 추출한 후 각 채널의 최대값을 연결하여 상기 텍스트의 분류 결과를 출력하되, 상기 각 채널의 최대값을 연결하기 위한 연결층(concatenate layer)가 맥스풀링층과 완전 연결층 사이에 구비되는 것을 특징으로 하는 텍스트 분류 방법
3 3
제2 항에 있어서, 제1 채널과 제2 채널에 구비되는 필터 종류는 상이하되, 각각의 필터 종류별 필터 개수는 복수인 것을 특징으로 하는 텍스트 분류 방법
4 4
제1 항에 있어서, 상기 워드 기반 임베딩은, 상기 워드 단위로 구분된 텍스트를 각 워드간 유사도를 고려하여 기설정된 벡터 사전을 통해 벡터값을 도출하는 것을 특징으로 하는 텍스트 분류 방법
5 5
제1 항에 있어서, 상기 문자 기반 임베딩은, 상기 문자 단위로 구분된 텍스트를 각각 문자별 유니코드 포인트로 변환하여 벡터값을 도출하는 것을 특징으로 하는 텍스트 분류 방법
6 6
제1 항에 있어서, 상기 텍스트는 짧은 비정형화된 문장인 것을 특징으로 하는 텍스트 분류 방법
7 7
제1 항 내지 제6 항 중 어느 하나의 항에 따른 방법을 수행하기 위한 프로그램 코드를 기록한 컴퓨터로 판독 가능한 기록매체
8 8
각 텍스트를 워드 단위와 문자 단위로 각각 구분하는 텍스트 전처리부;상기 워드 단위로 구분된 텍스트를 워드 기반 임베딩하여 벡터값으로 변환하고, 상기 문자 단위로 구분된 텍스트를 문자 기반 임베딩하여 벡터값으로 변환하는 임베딩부; 및복수의 채널을 구비하며, 각각의 채널을 통해 상기 워드 기반 임베딩된 실수 벡터값과 상기 문자 기반 임베딩된 벡터값을 입력받은 후 기설정된 분류 항목에 따라 분류하여 상기 텍스트의 분류 결과를 출력하는 텍스트 분류 모델부; 및텍스트에 상응하여 워드 기반 임베딩된 벡터값과 문자 기반 임베딩된 벡터값을 상기 텍스트 분류 모델부에 입력값으로 입력한 후 분류 결과를 설정하여 상기 텍스트 분류 모델부의 내부 가중치를 조정하도록 하여 상기 텍스트 분류 모델부를 트레이닝하는 학습부를 포함하는 텍스트 분류 장치
9 9
제8 항에 있어서, 상기 텍스트 분류 모델부는, 복수의 채널을 통해, 워드 기반 임베딩된 실수 벡터값과 상기 문자 기반 임베딩된 벡터값을 각각 입력받고, 각 필터 사이즈에 대해 합성곱을 수행하여 출력값을 출력하며, 맥스풀링을 통해 상기 각 필터 사이즈에서 출력된 출력값들 중 최대값을 추출한 후 각 채널의 최대값을 연결하여 상기 텍스트의 분류 결과를 출력하되, 상기 각 채널의 최대값을 연결하기 위한 연결층(concatenate layer)이 맥스풀링층과 완전 연결층 사이에 구비되는 것을 특징으로 하는 텍스트 분류 장치
10 10
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 첨단융복합콘텐츠기술개발 상대방의 감성을 추론, 판단하여 그에 맞추어 대화하고 대응할 수 있는 감성 지능 연구개발