맞춤기술찾기

이전대상기술

한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법 및 장치

  • 기술번호 : KST2020017023
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 한국어의 특성에 알맞는 알고리즘을 이용한 한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법 및 장치에 관한 것이다. 본 발명의 일 실시예에 따른 어휘 목록 생성 장치는 어휘 목록 생성을 위하여 한국어 데이터를 수신하는 데이터 수신부; 상기 수신한 한국어 데이터에 대하여 부분 단어 분리 알고리즘을 수행하여 상기 알고리즘에 따라 한국에 데이터에 포함된 단어들을 부분 단어로 분리하는 제1 연산부; 및 상기 분리된 부분 단어에 대해 정규화 알고리즘을 수행하여 상기 어휘 목록을 생성하는 제2 연산부를 포함할 수 있다.
Int. CL G06F 40/20 (2020.01.01) G06N 3/08 (2006.01.01)
CPC
출원번호/일자 1020190159637 (2019.12.04)
출원인 경희대학교 산학협력단
등록번호/일자
공개번호/일자 10-2020-0137936 (2020.12.09) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020190063396   |   2019.05.29
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.12.04)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 경희대학교 산학협력단 대한민국 경기도 용인시 기흥구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 허의남 경기도 용인시 기흥구
2 김만수 경상남도 진주시 신안들말길

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지원 대한민국 서울특별시 금천구 가산디지털*로 ***, ***호(가산동, 에이스테크노타워**차)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.12.04 수리 (Accepted) 1-1-2019-1252362-94
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 어휘 목록 생성을 위하여 한국어 데이터를 수신하는 단계;(b) 상기 수신한 한국어 데이터에 대해 부분 단어(subword) 분리 알고리즘을 수행하여 상기 알고리즘에 따라 한국어 데이터에 포함된 단어들을 부분 단어로 분리하는 단계; 및(c) 상기 분리된 부분 단어에 대해 정규화(regularization) 알고리즘을 수행하여 어휘 목록을 생성하는 단계를 포함하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
2 2
제1항에 있어서,상기 (b) 단계에서,상기 부분 단어 분리 알고리즘은 다음의 수학식으로 정의되는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
3 3
제1항에 있어서,상기 (b) 단계는,상기 부분 단어 분리 알고리즘을 이용하여, 상기 수신한 한국어 데이터에 포함된 단어들을 왼쪽 부분 단어 및 오른쪽 부분 단어로 분리하는 단계인,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
4 4
제3항에 있어서,상기 (b) 단계는,상기 오른쪽 부분 단어가 존재하는 경우,상기 오른쪽 부분 단어에 대하여 상기 부분 단어 분리 알고리즘을 수행하는 단계를 반복하는 단계를 더 포함하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
5 5
제1항에 있어서,상기 (c) 단계에서,상기 정규화 알고리즘은 다음의 수학식으로 정의되는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
6 6
제5항에 있어서,상기 (c) 단계는,상기 regScore 값이 큰 순서대로 기설정된 비율만큼 상기 부분 단어를 삭제하는 단계를 더 포함하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
7 7
제6항에 있어서,상기 (c) 단계는,상기 어휘 목록의 기설정된 단어 개수를 만족할 때까지 상기 부분 단어를 삭제하는 단계를 반복하는 단계를 더 포함하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 방법
8 8
제1항 내지 제7항 중 어느 한 항에 기재된 방법을 컴퓨터 상에서 수행하기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
9 9
어휘 목록 생성을 위하여 한국어 데이터를 수신하는 데이터 수신부;상기 수신한 한국어 데이터에 대하여 부분 단어 분리 알고리즘을 수행하여 상기 알고리즘에 따라 한국에 데이터에 포함된 단어들을 부분 단어로 분리하는 제1 연산부; 및상기 분리된 부분 단어에 대해 정규화 알고리즘을 수행하여 상기 어휘 목록을 생성하는 제2 연산부를 포함하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
10 10
제9항에 있어서,상기 부분 단어 분리 알고리즘은 다음의 수학식으로 정의되는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
11 11
제9항에 있어서,상기 부분 단어 분리 알고리즘은, 상기 수신한 한국어 데이터에 포함된 단어들을 왼쪽 부분 단어 및 오른쪽 부분 단어로 분리하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
12 12
제11항에 있어서,상기 제1 연산부는 상기 한국어 데이터에 포함된 단어들을 분리한 후,상기 오른쪽 부분 단어가 존재하는 경우,상기 오른쪽 부분 단어에 대하여 상기 부분 단어 분리 알고리즘을 반복하여 수행하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
13 13
제9항에 있어서,상기 정규화 알고리즘은 다음의 수학식으로 정의되는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
14 14
제13항에 있어서,상기 제2 연산부는,상기 regScore 값이 큰 순서대로 기설정된 비율만큼 상기 부분 단어를 삭제하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
15 15
제14항에 있어서,상기 제2 연산부는,상기 어휘 목록의 기설정된 단어 개수를 만족할 때까지 상기 부분 단어 삭제를 반복하여 수행하는,한국어 기반 신경망 언어 모델을 위한 어휘 목록 생성 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 경희대학교 산학협력단 ICT유망기술개발지원(R&D) 이어셋 기반 스마트 회의 서비스 개발을 위한 모바일 클라우드 기반 운영 기술 개발