맞춤기술찾기

이전대상기술

언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법

  • 기술번호 : KST2019001383
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 기존의 일반적인 단어 임베딩 벡터가 언어 분석기별 특징을 잘 표현하지 못하는 문제점을 언어 분석기별 정답 레이블 분포 벡터를 결합하여 해결함으로써, 기존 시스템과 비교하여 성능을 향상하는 방법을 제공하기 위한 것으로서, (A) 학습 모델로 Bidirectional LSTM CRF를 이용하여 한국어 개체명을 인식하는 단계와, (B) 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반 단어 임베딩 벡터 중 적어도 하나를 사용하여 입력되는 단어 표상을 확장하는 단계와, (C) 상기 확장된 단어 표상으로 LSTM을 이용하여 단어를 이루고 있는 음절 단위의 벡터들을 결합하여 단어 단위 벡터 및 분석기별 정답 레이블 분포 벡터를 결합하는 단계와, (D) 분포 벡터에 활성화 함수인 소프트맥스(softmax)를 이용하여 확률로 변환하여 모델로 입력하는 단계를 포함하여 이루어지는 것을 특징으로 한다.
Int. CL G06F 17/27 (2006.01.01) G06N 3/08 (2006.01.01)
CPC G06F 40/205(2013.01) G06F 40/205(2013.01) G06F 40/205(2013.01) G06F 40/205(2013.01)
출원번호/일자 1020170104871 (2017.08.18)
출원인 동아대학교 산학협력단
등록번호/일자 10-2012404-0000 (2019.08.13)
공개번호/일자 10-2019-0019661 (2019.02.27) 문서열기
공고번호/일자 (20190820) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.08.18)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 대한민국 부산광역시 사하구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고영중 대한민국 부산광역시 해운대구
2 유홍연 대한민국 울산광역시 북구
3 윤정민 대한민국 부산광역시 북구
4 안재현 대한민국 부산광역시 연제구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 정기택 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2 오위환 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
3 나성곤 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 동아대학교 산학협력단 부산광역시 사하구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.08.18 수리 (Accepted) 1-1-2017-0799205-60
2 선행기술조사의뢰서
Request for Prior Art Search
2018.08.07 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2018.10.11 수리 (Accepted) 9-1-2018-0052688-11
4 심사처리보류(연기)보고서
Report of Deferment (Postponement) of Processing of Examination
2018.10.31 발송처리완료 (Completion of Transmission) 9-6-2018-0131596-67
5 의견제출통지서
Notification of reason for refusal
2018.12.03 발송처리완료 (Completion of Transmission) 9-5-2018-0828558-12
6 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2019.02.07 수리 (Accepted) 1-1-2019-0129278-70
7 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2019.03.04 수리 (Accepted) 1-1-2019-0220082-97
8 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2019.04.02 수리 (Accepted) 1-1-2019-0339024-16
9 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2019.04.02 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2019-0339118-09
10 등록결정서
Decision to grant
2019.08.05 발송처리완료 (Completion of Transmission) 9-5-2019-0562084-56
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
딥 러닝(Deep Learning) 모델인 Bidirectional LSTM CRF(Long Short-term Memory Conditional Random Fields)를 이용하는 분석기에서 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해를 위하여,(A) 학습 모델로 Bidirectional LSTM CRF를 이용하여 입력 계층(Input Layer)을 통하여 입력 문자열을 양방향으로 받아서 한국어 개체명을 인식하는 단계와,(B) Bidirectional LSTM CRF의 입력 계층(Input Layer)에서 사전 학습된 단어 임베딩 벡터, 품사 임베딩 벡터, 음절 기반 단어 임베딩 벡터 중 적어도 하나를 사용하여 입력되는 단어 표상을 확장하는 단계와,(C) Bidirectional LSTM CRF의 은닉 계층(Hidden Layer)에서 forward의 마지막 상태와 backward의 마지막 상태를 결합하여 단어 단위 임베딩 벡터로 사용하고, 상기 확장된 단어 표상으로 LSTM을 이용하여 단어를 이루고 있는 음절 단위의 벡터들을 결합하여 단어 단위 벡터 및 분석기별 정답 레이블 분포 벡터를 결합하는 단계와,(D) 분포 벡터에 활성화 함수인 소프트맥스(softmax)를 이용하여 확률로 변환하여 모델로 입력하는 단계를 포함하고, (A) ~ (D) 단계를 딥 러닝(Deep Learning) 모델인 Bidirectional LSTM CRF(Long Short-term Memory Conditional Random Fields)를 이용하는 분석기에서 수행하는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
2 2
제 1 항에 있어서, 상기 (A) 단계는 LSTM에 입력 문자열을 양방향으로 받아서 각 단어 별로 은닉 계층의 결과를 얻고, 그 결과 간의 의존성을 추가하는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
3 3
제 1 항에 있어서, 상기 (B) 단계에서 단어 임베딩 벡터는 3GB의 뉴스 말뭉치 및 word2vec의 CBOW 모델을 사용하여 단어 임베딩을 사전 학습하는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
4 4
제 3 항에 있어서,상기 사전 학습되는 단어의 단위는 형태소와 품사태그가 결합된 형태로 사용되는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
5 5
제 1 항에 있어서, 상기 (B) 단계에서 품사 임베딩 벡터는 3GB의 뉴스 말뭉치를 형태소 분석 후 단어를 삭제한 뒤 품사를 임베딩의 단위로 사용하여 품사 단위를 사전 학습하는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
6 6
제 1 항에 있어서, 상기 (B) 단계에서 음절 기반 단어 임베딩 벡터는 단어 단위의 임베딩 벡터로 확장한 벡터인 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
7 7
제 6 항에 있어서, 상기 음절 기반 단어 임베딩 벡터는 음절별로 각 개체명 태그별 분포를 벡터로 만들어서 사용하는 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
8 8
제 1 항에 있어서, 상기 (C) 단계에서 분석기별 정답 레이블 분포 벡터는 입력되는 단어에 대응되는 분석기별 정답 레이블이 학습 데이터에서 얼마나 출현했는지를 분포로 계산하여 벡터로 나타낸 것을 특징으로 하는 언어 분석기별 정답 레이블 분포를 이용한 자연어 이해 방법
9 9
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 동아대학교 산학협력단 정보통신 방송 연구개발사업 기계학습용 텍스트 데이터 레이블 자동생성 및 검증도구 개발