맞춤기술찾기

이전대상기술

의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템

  • 기술번호 : KST2021002769
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 의미 추상화를 통해 비교적 적은 수의 문장에 대한 학습만으로 상위어가 추출되게 하여, 확장된 문장에 있어서의 의존관계를 도출할 수 있도록 하는 전이 기반의 한국어 의존관계 분석시스템에 관한 것이다. 이러한 본 발명은 입력된 문장의 형태소를 분석하는 형태소 분석모듈과, 분석된 형태소 정보에서 체언류의 표층형의 추상화된 정보를 데이터베이스로부터 획득하는 체언 추상화 모듈, 및 상기 체언의 추상화된 표층형 정보와 학습 말뭉치로부터 학습된 자질 정보를 이용하여 어절 간 의존관계를 분석하는 의존관계 분석 모듈을 포함하여 구성된다.
Int. CL G06F 40/20 (2020.01.01)
CPC
출원번호/일자 1020190160737 (2019.12.05)
출원인 울산대학교 산학협력단
등록번호/일자
공개번호/일자 10-2021-0023640 (2021.03.04) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020190103819   |   2019.08.23
법적상태 등록
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.12.05)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 울산대학교 산학협력단 대한민국 울산광역시 남구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 옥철영 울산광역시 남구
2 정충선 울산광역시 중구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이형석 대한민국 서울특별시 강남구 역삼로*길 **, 광성빌딩 **층 (역삼동)(케이엘피특허법률사무소)
2 김종선 대한민국 서울특별시 강남구 역삼로*길 **, 광성빌딩 **층 (역삼동)(케이엘피특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.12.05 수리 (Accepted) 1-1-2019-1259086-05
2 [공지예외적용대상(신규성, 출원시의 특례)증명서류]서류제출서
[Document Verifying Exclusion from Being Publically Known (Novelty, Special Provisions for Application)] Submission of Document
2019.12.09 수리 (Accepted) 1-1-2019-1270182-94
3 [출원서 등 보완]보정서
2019.12.09 수리 (Accepted) 1-1-2019-1270158-08
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.07.10 수리 (Accepted) 4-1-2020-5154267-54
5 선행기술조사의뢰서
Request for Prior Art Search
2021.03.19 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력된 문장의 형태소를 분석하는 형태소 분석모듈; 분석된 형태소 정보에서 체언류의 표층형의 추상화된 정보를 데이터베이스로부터 획득하는 체언 추상화 모듈; 및 상기 체언의 추상화된 표층형 정보와 학습 말뭉치로부터 학습된 자질 정보를 이용하여 어절 간 의존관계를 분석하는 의존관계 분석 모듈을 포함하는 전이 기반 한국어 의존관계 분석 시스템
2 2
제 1 항에 있어서,상기 형태소 분석모듈은, 상기 입력된 문장의 형태소 분석 결과와 동형이의어 분별 결과를 제공하며,상기 형태소 분석결과는 형태소 단위로 표층형, 동형이의어 번호, 다의어 번호, 품사 태그가 부착되어 출력되고, 상기 분석결과로부터 입력 문장의 어절 단위와 형태소 단위로 표층형과 동형이의어 번호, 품사 태그 정보를 수집하는 의미 추상화를 이용한 전이 기반 한국어 의존관계 분석 시스템
3 3
제 1 항에 있어서, 상기 체언 추상화 모듈은, 어휘 의미망을 활용하여 명사의 표층형을 추상화하여 자질로 사용하며, 상기 어휘 의미망은 명사의 계층 구조를 트리 구조로 제공하며, 상위어 정보를 통해 명사의 표층형 정보를 추상화하는 전이 기반 한국어 의존관계 분석 시스템
4 4
제 3 항에 있어서,상기 표층형의 추상화는, 학습 말뭉치를 동형이의어로 분별하였고, 동형이의어로 분별된 정보를 기초로 어휘 의미망의 단어 계층에 따라 명사를 추상화하는 전이 기반 한국어 의존관계 분석 시스템
5 5
제 4 항에 있어서, 상기 명사의 표층형 추상화는, 표층형 자질, 추상화 자질을 포함한 어절단위 자질의 기본자질, 형태소 단위 및 음절 단위 확장 자질을 모두 학습하는 전이 기반 한국어 의존관계 분석 시스템
6 6
제 3 항에 있어서, 상기 체언 추상화 모듈은, 입력 문장의 형태소 단위의 품사 태그를 확인하여 체언류 형태소를 구분하고,체언류 형태소에 대하여 상기 어휘 의미망에 해당 단어 정보가 있는지 확인하고, 상기 어휘 의미망에 없는 단어는 추상화하지 않고 정보가 있는 단어는 어휘 의미망의 단어 계층을 계산하고, 상기 동형이의어를 기준으로 동형이의어가 갖는 모든 다의어에 대하여 단어 계층을 모두 계산하고, 계산된 모든 다의어에 대하여 설정된 추상화 레벨만큼 상위 계층 단어로 추상화하며, 추상화된 단어 중 빈도가 가장 높은 단어를 해당 동형이의어의 추상화된 단어로 결정하는 전이 기반 한국어 의존관계 분석 시스템
7 7
제 6 항에 있어서,상기 체언 추상화 모듈은, 추상화의 단계가 최고 단계를 초과하는 경우, 추상화 단계가 어휘 의미망의 최상위 단계 이상이 되면 root 노드 아래의 1계층 단어로 추상화하는 제1 방법과, 추상화를 하지 않고 원형을 그대로 사용하는 제2 방법 중 하나에 의해 수행되는 전이 기반 한국어 의존관계 분석 시스템
8 8
제 1 항에 있어서, 상기 의존관계 분석모듈은, 한국어의 특징이 고려된 전이 기반 모델에 맞춰 입력 문장의 순서를 역순으로 입력 버퍼에 입력하고, 자질 함수를 통해 각 자질의 값을 구하여 전이(transition)을 결정하며, 상기 전이결정에 따라 상기 입력 버퍼의 모든 어절이 의존관계가 결정되어 입력 버퍼에 존재하는 어절이 없으면 의존관계 분석을 종료하고 입력 문장의 각 어절의 지배소 어절의 어절 위치를 기록하여 의존관계 결과를 출력하는 전이 기반 한국어 의존관계 분석 시스템
9 9
제 8 항에 있어서,상기 의존관계 분석에 따른 기본 자질 성능 평가에서, 일반화된 품사 태그 자질(generalized POS)이 가장 높은 재현율을 제공하며, 표층형과 동형 이의의 번호, 품사 태그 합 자질(BPS)이 가장 높은 정확율을 제공하는 전이 기반 한국어 의존관계 분석 시스템
10 10
제 8 항에 있어서, 상기 의존관계 분석에 따른 확장 자질 성능 평가에서, 확장 자질의 재현율과 정확률은 상기 기본 자질에 비해 재현율은 높고, 정확률이 낮은 전이 기반 한국어 의존관계 분석 시스템
11 11
제 8 항에 있어서, 상기 의존관계 분석에 따른 확장 자질 성능 평가에서, 형태소 자질과 음절 자질을 모두 사용한 경우가 가장 높은 의존관계 정확율을 제공하는 전이 기반 한국어 의존관계 분석 시스템
12 12
제 1 항에 있어서, 상기 의존관계 분석 모듈의 분석방법은, 한국어의 지배소 후위 원칙을 이용한 수정된 backward arc-eager 알고리즘을 사용하여 전이 기반 의존관계를 분석하고, 상기 수정된 backward arc-eager 알고리즘은 기본 arc-eager 알고리즘에서 right-arc, shift transition은 제거되고 left-arc transition에서 stack의 어절을 제거하지 않고 buffer로 이동시키는 방법으로 분석하는 전이 기반 한국어 의존관계 분석 시스템
13 13
제 12 항에 있어서, 상기 의존관계 분석에 따른 의존관계정확률 및 자질 정확률은 다음 식에 의해 계산되는 전이 기반 한국어 의존관계 분석 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 SW컴퓨팅산업원천기술개발사업 컨텍스트 인지형 Deep-Symbolic 하이브리드 지능 원천 기술 개발 및 언어 지식 자원 구축