맞춤기술찾기

이전대상기술

의존 구문 분석 시스템 및 이를 이용한 의존 구문 분석 방법

  • 기술번호 : KST2021006760
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 적어도 하나의 프로세서에 의해 동작하는 의존 구문 분석 시스템이 입력 문장의 의존 구문을 분석하는 방법으로서, 복수의 어절들을 포함하는 문장을 수신하면, 문장에 대한 제1 임베딩과 제2 임베딩을 생성하고, 제1 임베딩과 제2 임베딩을 병합하여 입력 임베딩으로 생성한다. 의존 구문 분석 시스템의 Right to Left 네트워크인 포인터 네트워크가 입력 임베딩을 기초로 상기 문장에 대한 은닉 표상을 생성한 후, 은닉 표상과 복수의 어절들 중 가장 오른쪽 어절부터 입력으로 받고, 입력된 어절에 대한 의존 관계와 의존 관계명을 예측하여, 입력 임베딩에 대한 관계를 출력한다. 그리고 입력 임베딩에 대한 관계를 기초로, 문장에서 각 어절들의 지배소와 의존소를 포함하는 의존 구문 트리를 출력한다.
Int. CL G06F 40/211 (2020.01.01) G06F 40/268 (2020.01.01) G06F 40/289 (2020.01.01)
CPC
출원번호/일자 1020200154863 (2020.11.18)
출원인 서강대학교산학협력단
등록번호/일자
공개번호/일자 10-2021-0061284 (2021.05.27) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020190149049   |   2019.11.19
법적상태 공개
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.11.18)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서정연 서울특별시 서초구
2 박영준 서울특별시 마포구
3 한장훈 서울특별시 용산구
4 정영훈 경기도 성남시 분당구
5 이인권 서울특별시 용산구
6 한정욱 서울특별시 마포구
7 박서준 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 유미특허법인 대한민국 서울특별시 강남구 테헤란로 ***, 서림빌딩 **층 (역삼동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.11.18 수리 (Accepted) 1-1-2020-1239325-78
2 공지예외적용주장 증명서류 제출기한 안내문
2020.11.24 발송처리완료 (Completion of Transmission) 1-5-2020-0175923-41
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
적어도 하나의 프로세서에 의해 동작하는 의존 구문 분석 시스템이 입력 문장의 의존 구문을 분석하는 방법으로서,복수의 어절들을 포함하는 문장을 수신하면, 상기 문장에 대한 제1 임베딩과 제2 임베딩을 생성하고, 상기 제1 임베딩과 제2 임베딩을 병합하여 입력 임베딩으로 생성하는 단계,상기 의존 구문 분석 시스템의 포인터 네트워크가 상기 입력 임베딩을 기초로 상기 문장에 대한 은닉 표상을 생성하는 단계,상기 은닉 표상과 상기 복수의 어절들 중 가장 오른쪽 어절부터 입력으로 받고, 입력된 어절에 대한 의존 관계와 의존 관계명을 예측하여, 상기 입력 임베딩에 대한 관계를 출력하는 단계, 그리고상기 입력 임베딩에 대한 관계를 기초로, 상기 문장에서 각 어절들의 지배소와 의존소를 포함하는 의존 구문 트리를 출력하는 단계를 포함하고,상기 포인터 네트워크는 Right to Left 네트워크인, 의존 구문 분석 방법
2 2
제1항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 문장을 제1 임베딩 모델에 입력하여 상기 제1 임베딩으로 출력하고,상기 문장을 제2 임베딩 모델에 입력하여 상기 제2 임베딩으로 출력하며,상기 제1 임베딩 모델과 제2 임베딩 모델은 ELMo(Embedding from Language Model) 또는 BERT(Bidirectional Encoder Representations from Transformers) 중 어느 하나의 모델인, 의존 구문 분석 방법
3 3
제2항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 제1 임베딩 모델에서, 상기 각 어절별 복수의 형태소들 중, 첫 번째 형태소와 마지막 형태소를 병합하여 상기 제1 임베딩으로 출력하고,상기 제2 임베딩 모델에서, 상기 복수의 형태소들 각각의 토큰들 중, 첫 번째 형태소의 첫 번째 토큰과 마지막 형태소의 첫 번째 토큰을 병합하여 상기 제2 임베딩으로 출력하는, 의존 구문 분석 방법
4 4
제3항에 있어서,상기 입력 임베딩으로 생성하는 단계는,상기 문장이 형태소 분석되어 있는지 확인하는 단계, 그리고형태소 분석이 완료되지 않았으면, 상기 문장의 상기 각 어절들에 대한 형태소를 분석하는 단계를 포함하는, 의존 구문 분석 방법
5 5
제4항에 있어서,상기 관계를 출력하는 단계는,상기 포인터 네트워크는 BiLSTM(Bidirectional Long Short-Term Memory)으로 구성된 인코더와 단방향 LSTM으로 구성된 디코더로 구성되고,상기 인코더를 구성하는 어느 하나의 셀이, 복수의 어절들 중 어느 하나의 어절에 대한 입력 임베딩을 수신하는 단계, 상기 셀을 기준으로 제1 방향에 위치한 제1 이전 셀과 제2 방향에 위치한 제2 이전 셀로부터, 각각 이전 셀들까지 처리된 어절별 은닉 표상들을 수신하는 단계, 상기 어절의 입력 임베딩과 어절별 은닉 표상들을 기초로 상기 셀에서 상기 어절에 대한 어절별 출력 표상을 출력하는 단계, 그리고, 상기 디코더로 상기 입력 임베딩의 은닉 표상을 전달하는 단계 를 포함하는, 의존 구문 분석 방법
6 6
제5항에 있어서,상기 관계를 출력하는 단계는,상기 디코더가 상기 인코더로부터 상기 은닉 표상을 수신하는 단계,상기 인코더로부터 상기 가장 오른쪽 어절부터 입력되는 어절들 중 어느 하나의 어절에 대한 어절별 출력 표상과 상기 제1 이전 셀과 제2 이전 셀에서 각각 출력된 이전 셀들의 어절별 출력 표상을 입력 받는 단계, 그리고상기 은닉 표상, 상기 어절별 출력 표상, 상기 각각 출력된 이전 셀들의 어절별 출력 표상을 기초로, 상기 어느 하나의 어절에 대한 디코더 출력 표상을 출력하는 단계를 포함하는, 의존 구문 분석 방법
7 7
제6항에 있어서,상기 관계를 출력하는 단계는,상기 어느 하나의 어절에 대한 상기 인코더 출력 표상과 디코더 출력 표상을 기초로, 상기 어느 하나의 어절에 대한 지배소를 출력하는 단계를 포함하는, 의존 구문 분석 방법
8 8
입력 문장의 의존 구문을 분석하는 시스템으로서,복수의 어절들로 구성된 문장으로부터 제1 임베딩과 제2 임베딩을 생성하고, 상기 생성한 제1 임베딩과 제2 임베딩을 병합하여 입력 임베딩으로 생성하는 임베딩 생성부, 그리고상기 입력 임베딩에서 상기 문장의 오른쪽부터 순차적으로 각 어절별로 의존 관계와 의존 관계명을 예측하고, 상기 예측한 어절별로 의존 관계와 의존 관계명을 포함하는 관계를 출력하는 포인터 네트워크를 포함하고,상기 포인터 네트워크는 Right to Left 포인터 네트워크인, 의존 구문 분석 시스템
9 9
제8항에 있어서,상기 문장이 형태소 분석되어 있는지 확인하고, 형태소 분석이 완료되지 않았으면 상기 각 어절에 대한 형태소를 분석하는 전처리부를 더 포함하는, 의존 구문 분석 시스템
10 10
제9항에 있어서,상기 임베딩 생성부는,상기 문장을 상기 제1 임베딩으로 출력하는 제1 임베딩 모델,상기 문장을 상기 제2 임베딩으로 출력하는 제2 임베딩 모델, 그리고상기 제1 임베딩 모델과 제2 임베딩 모델을 병합하는 병합 모델을 포함하고,상기 제1 임베딩 모델과 제2 임베딩 모델은 ELMo(Embedding from Language Model) 또는 BERT(Bidirectional Encoder Representations from Transformers) 중 어느 하나의 모델인, 의존 구문 분석 시스템
11 11
제10항에 있어서,상기 포인터 네트워크는,BiLSTM으로 구성되며, 각 어절별 입력 임베딩, 각 어절의 형태소, 품사 태그, 이전 어절에서 문장의 구조를 반영한 이전 어절의 대표 값인 어절별 은닉 표상을 기초로 각 어절에 대한 인코더 출력 표상을 출력하고, 마지막 어절의 은닉 표상을 상기 문장의 은닉 표상으로 생성하는 인코더, 그리고상기 문장의 은닉 표상과 각 어절에 대한 인코더 출력 표상을 입력으로 받아, 상기 각 어절에 대한 디코더 출력 표상을 생성하되, 상기 각 어절은 상기 문장의 오른쪽 어절부터 입력되는 디코더를 포함하고,상기 각 어절에 대한 인코더 출력 표상과 디코더 출력 표상을 기초로 상기 각 어절에 대한 지배소를 예측하는, 의존 구문 분석 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 과학기술정보통신부 정보통신방송기술개발사업 기계학습용 텍스트 데이터 레이블 자동생성 및 검증도구 개발