맞춤기술찾기

이전대상기술

한국어 개체명 인식방법 및 장치

  • 기술번호 : KST2019025677
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명에 따르는 한국어 개체명 인식방법은, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하고, 한국어 로 텍스트에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 한국어 로 텍스트에 대한 음절 바이그램들에 대응되는 임베딩을 생성하고, 상기 한국어 로 텍스트에 대한 음절 바이그램들 각각과 그에 대응되는 임베딩을 데이터베이스의 룩업테이블에 기록하는 제1단계; 및 질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하고, 상기 질의 문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 질의 문장에 대한 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 제2단계;를 포함하는 것을 특징으로 한다.
Int. CL G06F 17/27 (2006.01.01) G06N 99/00 (2019.01.01)
CPC G06F 40/295(2013.01) G06F 40/295(2013.01)
출원번호/일자 1020170134970 (2017.10.18)
출원인 서강대학교산학협력단
등록번호/일자 10-1941692-0000 (2019.01.17)
공개번호/일자
공고번호/일자 (20190123) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.10.18)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권순재 서울시 동작구
2 고영중 부산광역시 해운대구
3 서정연 서울특별시 서초구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이지연 대한민국 서울특별시 관악구 남부순환로 ****, ***호 제니스국제특허법률사무소 (봉천동, 청동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 서울특별시 마포구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.10.18 수리 (Accepted) 1-1-2017-1024398-10
2 등록결정서
Decision to grant
2018.11.21 발송처리완료 (Completion of Transmission) 9-5-2018-0795940-98
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.01.22 수리 (Accepted) 4-1-2019-5014626-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
한국어 개체명 인식방법에 있어서, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하고, 한국어 로 텍스트에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 한국어 로 텍스트에 대한 음절 바이그램들에 대응되는 임베딩을 생성하고, 상기 한국어 로 텍스트에 대한 음절 바이그램들 각각과 그에 대응되는 임베딩을 데이터베이스의 룩업테이블에 기록하는 제1단계; 및 질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하고, 상기 질의 문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램에 대해 표식을 부가한 후에, 상기 질의 문장에 대한 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 제2단계;를 포함하는 것을 특징으로 하는 한국어 개체명 인식방법
2 2
제1항에 있어서, 상기 제1단계가, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하는 단계;상기 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식한 후에, 음절 바이그램들을 인공신경망 기반 비지도 학습하여 음절 바이그램의 의미를 나타내는 고차원 벡터 표현인 임베딩을 생성하는 단계; 및 상기 음절 바이그램들 각각과 그에 대응되는 임베딩을 대응시켜 룩업테이블에 기록하는 단계;를 포함하는 것을 특징으로 하는 한국어 개체명 인식방법
3 3
제1항에 있어서, 상기 제2단계에서, 상기 개체명 인식은 기계학습기반의 딥러닝 알고리즘으로 수행됨을 특징으로 하는 한국어 개체명 인식방법
4 4
한국어 개체명 인식장치에 있어서, 한국어 로 텍스트를 입력받아 분할한 음절 바이그램들 중 어절 어두에 위치함이 표식된 음절 바이그램들과 나머지 음절 바이그램들에 대해, 상기 음절 바이그램들 각각과 그에 대응되는 임베딩을 대응시켜 기록한 룩업 테이블을 구비하는 데이터베이스;질의문장이 입력되면, 질의문장을 음절 바이그램들로 분할하여 출력하는 음절 바이그램 분할부;상기 질의문장에 대한 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식을 부가하는 어절 어두 음절 바이그램 판별 및 표식부;상기 어절 어두 음절 바이그램 판별 및 표식부가 출력하는 음절 바이그램들에 대응되는 임베딩을 상기 룩업테이블로부터 독출하여 개체명 인식을 이행하는 개체명 인식부;를 포함하는 것을 특징으로 하는 한국어 개체명 인식장치
5 5
제4항에 있어서, 한국어 로 텍스트를 입력받아 음절 바이그램들로 분할하는 음절 바이그램 분할부;상기 음절 바이그램들 중 어절 어두에 위치하는 음절 바이그램을 검출하여 표식하는 어절 어두 음절 바이그램 판별 및 표식부; 및 상기 음절 바이그램들을 인공신경망 기반 비지도 학습하여 음절 바이그램의 의미를 나타내는 고차원 벡터 표현인 임베딩을 생성하여 상기 음절 바이그램들과 그에 대응되는 임베딩을 대응시켜 상기 룩업 테이블에 기록하는 음절 바이그램 임베딩 학습부;를 더 포함하는 것을 특징으로 하는 한국어 개체명 인식장치
6 6
제4항에 있어서, 상기 개체명 인식부는, 기계학습기반의 딥러닝 알고리즘에 따라 개체명을 인식함을 특징으로 하는 한국어 개체명 인식장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서강대학교 산학협력단 SW컴퓨팅산업원천기술개발(R&D,정보화)사업 기계학습용 텍스트 데이터 레이블 자동생성 및 검증도구 개발 (Development of Automatic Text Data Labeling and Verification Tools for Machine Learning)