맞춤기술찾기

이전대상기술

간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법 및 시스템

  • 기술번호 : KST2020008185
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법에 관한 것으로서, 보다 구체적으로는 멀티-핫 벡터(multi-hot vector) 임베딩 방법으로서, (1) 문장을 수신하는 단계; (2) 상기 단계 (1)에서 수신된 문장의 음절에 포함된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하고, 상기 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 단계; 및 (3) 상기 단계 (2)에서 결합된 멀티-핫 벡터(multi-hot vector)를 출력하는 단계를 포함하는 것을 그 구성상의 특징으로 한다. 또한, 본 발명은 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템(10)에 관한 것으로서, 보다 구체적으로는 멀티-핫 벡터(multi-hot vector) 임베딩 시스템으로서, 문장을 수신하는 수신부(100); 상기 수신부(100)에 의해 수신된 문장의 음절에 포함된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하고, 상기 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 임베딩부(200); 및 상기 임베딩부(200)에 의해 결합된 멀티-핫 벡터(multi-hot vector)를 출력하는 출력부(300)를 포함하는 것을 그 구성상의 특징으로 한다. 본 발명에서 제안하고 있는 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법 및 시스템(10)에 따르면, 문장의 음절에 포함된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하고, 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합함으로써, 기존의 음절 기반 방법들보다 많은 수의 음절을 간결하게 표현할 수 있다. 또한, 본 발명에서 제안하고 있는 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법 및 시스템에 따르면, 멀티-핫 벡터(multi-hot vector)로 결합하여 음절을 표현함으로써, 기존의 자소분리 임베딩이 가지는 간결함을 살리면서도, 음절 단위 임베딩이 가지는 음절 자체의 성질을 유지할 수 있다. 뿐만 아니라, 본 발명에서 제안하고 있는 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법 및 시스템에 따르면, 멀티-핫 벡터(multi-hot vector)로 결합하여 음절을 표현함으로써, 기존의 자소분리 임베딩에서 구별하기 어려웠던 초성 또는 모음이 독립적으로 사용되는 경우도 포함하며, 별도의 벡터 사전(vector dictionary)이 필요하지 않아, 많은 디바이스에서 효율적으로 문장 또는 시퀀스를 수치화할 수 있다.
Int. CL G06F 40/12 (2020.01.01) G06F 40/20 (2020.01.01)
CPC G06F 40/157(2013.01) G06F 40/157(2013.01)
출원번호/일자 1020180167960 (2018.12.21)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2020-0078248 (2020.07.01) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2018.12.21)
심사청구항수 2

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김남수 서울특별시 서초구
2 조원익 서울특별시 광진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김건우 대한민국 서울특별시 금천구 가산디지털*로 ***, 에이동 ***호 특허그룹덕원 (가산동, 우림 라이온스밸리)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2018.12.21 수리 (Accepted) 1-1-2018-1294089-62
2 보정요구서
Request for Amendment
2019.01.04 발송처리완료 (Completion of Transmission) 1-5-2019-0002654-38
3 [출원서등 보정]보정서(납부자번호)
[Amendment to Patent Application, etc.] Amendment(Payer number)
2019.01.07 수리 (Accepted) 1-1-2019-0010731-06
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
6 선행기술조사의뢰서
Request for Prior Art Search
2019.07.11 수리 (Accepted) 9-1-9999-9999999-89
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
8 선행기술조사보고서
Report of Prior Art Search
2019.08.08 수리 (Accepted) 9-1-2019-0037853-97
9 의견제출통지서
Notification of reason for refusal
2020.03.21 발송처리완료 (Completion of Transmission) 9-5-2020-0209156-23
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.04.29 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0446388-10
11 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.04.29 수리 (Accepted) 1-1-2020-0446475-84
12 의견제출통지서
Notification of reason for refusal
2020.09.14 발송처리완료 (Completion of Transmission) 9-5-2020-0635109-13
13 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.11.13 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-1215625-19
14 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.11.13 수리 (Accepted) 1-1-2020-1215642-85
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
멀티-핫 벡터(multi-hot vector) 임베딩 방법으로서,(1) 문장을 수신하는 단계;(2) 상기 단계 (1)에서 수신된 문장의 음절에 포함된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하고, 상기 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 단계; 및(3) 상기 단계 (2)에서 결합된 멀티-핫 벡터(multi-hot vector)를 출력하는 단계를 포함하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법
2 2
제1항에 있어서, 상기 단계 (1)에서는,자음과 모음으로 이루어진 음절을 포함하는 문장을 수신하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법
3 3
제1항에 있어서, 상기 단계 (2)는,(2-1) 상기 단계 (1)에서 수신된 문장을 음절로 분리하는 단계;(2-2) 상기 단계 (2-1)에서 분리된 음절을 자음과 모음으로 분리하는 단계;(2-3) 상기 단계 (2-2)에서 분리된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하는 단계; 및(2-4) 상기 단계 (2-3)에서 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 단계를 포함하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법
4 4
제3항에 있어서, 상기 단계 (2-3)에서는,상기 단계 (2-2)에서 분리된 자음과 모음을 한 개 내지 세 개의 원-핫 벡터(one-hot vector)로 임베딩하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법
5 5
제4항에 있어서, 상기 단계 (2-4)에서는,상기 단계 (2-3)에서 임베딩된 한 개 내지 세 개의 원-핫 벡터(one-hot vector)를 하나의 멀티-핫 벡터(multi-hot vector)로 결합하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 방법
6 6
멀티-핫 벡터(multi-hot vector) 임베딩 시스템(10)으로서,문장을 수신하는 수신부(100);상기 수신부(100)에 의해 수신된 문장의 음절에 포함된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하고, 상기 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 임베딩부(200); 및상기 임베딩부(200)에 의해 결합된 멀티-핫 벡터(multi-hot vector)를 출력하는 출력부(300)를 포함하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템
7 7
제6항에 있어서, 상기 수신부(100)는,자음과 모음으로 이루어진 음절을 포함하는 문장을 수신하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템
8 8
제6항에 있어서, 상기 임베딩부(200)는,상기 수신부(100)에 의해 수신된 문장을 음절로 분리하는 문장 분리 모듈(210);상기 문장 분리 모듈(210)에 의해 분리된 음절을 자음과 모음으로 분리하는 음절 분리 모듈(220);상기 음절 분리 모듈(220)에 의해 분리된 자음과 모음을 원-핫 벡터(one-hot vector)로 임베딩하는 임베딩 모듈(230); 및상기 임베딩 모듈(230)에 의해 임베딩된 원-핫 벡터(one-hot vector)를 멀티-핫 벡터(multi-hot vector)로 결합하는 결합 모듈(240)을 포함하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템
9 9
제8항에 있어서, 상기 임베딩 모듈(230)은,상기 음절 분리 모듈(220)에 의해 분리된 자음과 모음을 한 개 내지 세 개의 원-핫 벡터(one-hot vector)로 임베딩하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템
10 10
제9항에 있어서, 상기 결합 모듈(240)은,상기 임베딩 모듈(230)에 의해 임베딩된 한 개 내지 세 개의 원-핫 벡터(one-hot vector)를 하나의 멀티-핫 벡터(multi-hot vector)로 결합하는 것을 특징으로 하는, 간결한 한글 음절 표현을 위한 멀티-핫 벡터 임베딩 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 한양대학교산학협력단 인공지능융합로봇시스템기술 로봇용 free-running 임베디드 자연어 대화음성인식을 위한 원천 기술 개발