맞춤기술찾기

이전대상기술

입력 문장을 사건구조프레임이 주석된 문장으로 출력하는 자동 주석방법

  • 기술번호 : KST2022016596
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 자연어 추론과 자연어 이해과제를 해결하기 위해 '사건구조프레임 주석 워드넷이라 명명한 자원과 그 자원을 이용하여 입력문장에 사건구조프레임을 자동 주석하는 방법에 관한 것으로 이를 통해 동사의 사건구조에 따른 다양한 추론을 가능케 한다. 본 발명은 GESL을 이용하여 워드넷에 사건구조프레임을 반자동 주석한 언어자원인 ESFWN과 자동 주석 도구를 연결한 것으로, ESFWN이 WordNet과 직접 대응함으로써 WordNet의 정보 이용과 다른 언어로의 적용을 용이하게 한다. 또한, 본 발명에 채택된 자동 주석 도구는 성능이 좋은 최신 WSD(Word Sense Disambiguation) 알고리즘과 SRL(Semantic Role Labeling) 시스템을 도입함으로써 훈련 데이터셋을 준비해야 하는 비용도 절감시킨다.
Int. CL G06F 40/169 (2020.01.01) G06F 40/247 (2020.01.01) G06F 40/30 (2020.01.01) G06F 40/263 (2020.01.01) G06F 40/284 (2020.01.01)
CPC G06F 40/169(2013.01) G06F 40/247(2013.01) G06F 40/30(2013.01) G06F 40/263(2013.01) G06F 40/284(2013.01)
출원번호/일자 1020210017290 (2021.02.08)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2022-0114146 (2022.08.17) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.02.08)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 정민화 서울특별시 관악구
2 임서현 경기도 광명시

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 문환구 대한민국 서울특별시 서초구 바우뫼로 ***, *층(두리암특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.02.08 수리 (Accepted) 1-1-2021-0156017-52
2 특허고객번호 정보변경(경정)신고서·정정신고서
2021.07.29 수리 (Accepted) 4-1-2021-5205564-29
3 특허고객번호 정보변경(경정)신고서·정정신고서
2022.04.04 수리 (Accepted) 4-1-2022-5079741-71
4 특허고객번호 정보변경(경정)신고서·정정신고서
2022.08.11 수리 (Accepted) 4-1-2022-5189083-38
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
프로세서 및 메모리를 포함하는 언어처리 시스템에서, 입력 문장을 사건구조프레임(Event Structure Frame: ESF)이 주석된 문장으로 출력하는 자동 주석방법으로, 상기 방법은:상기 언어처리 시스템에 의해, 동사를 포함하는 영어 문장을 입력하는 단계;상기 언어처리 시스템에 의해, 상기 입력된 영어 문장에서 동사를 추출하는 단계;상기 언어처리 시스템에 의해, 사전 정의된 사건구조프레임 유형(Event Structure Frame type)과 그에 따른 동사를 분류하는 사건구조프레임 목록(ESF-list)을 구비하고, 영어 단어의 유의어 집단인 신셋(SynSet)을 포함하는 언어자원인 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)에 연결하는 단계;상기 언어처리 시스템에 의해, 상기 추출된 동사에 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘을 이용하여 상기 동사의 신셋과 연결되는 아이디인 오프셋을 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 오프셋을 이용하여 상기 ESFWN에서 상기 동사의 사건구조프레임 유형을 찾아 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 사건구조프레임 유형(Event Structure Frame type)에 해당하는 사건구조프레임(ESF)을 사건구조프레임 목록(ESF-List)에서 찾아 출력하는 단계;상기 언어처리 시스템에 의해, 상기 출력된 동사의 사건구조프레임에서 시간순서를 가진 각각에 시간순서 해당 동사를 삽입하는 단계;상기 언어처리 시스템에 의해, 의미역 라벨러(Semantic Role Labeler)에 연결하는 단계; 상기 언어처리 시스템에 의해, 상기 입력된 영어문장에 의미역 라벨링 알고리즘을 적용하여 동사 고유의 특성에 따라 구성성분이 갖는 의미상 역할인 의미역을 출력하는 단계; 상기 언어처리 시스템에 의해, 논항 삽입 알고리즘을 이용하여 상기 출력된 의미역 해당 텍스트를 사건구조프레임의 각 논항 위치에 삽입하는 단계; 및상기 언어처리 시스템에 의해, 상기 논항이 삽입된 동사중심 사건구조 문장을 출력하는 단계를 포함하고, 상기 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘은 EWISER 또는 EWISER-Wrapper이며,상기 의미역 라벨링 알고리즘은 AllenNLP SRL인, 자동 주석방법
2 2
제 1항에 있어서,상기 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)은,23개의 사건구조프레임(Event Structure Frame: ESF) 유형을 가지는 주석도구인 GESL(Generator of the Event Structure Lexicon)을 영어동사에 적용하여 23개 유형으로 분류하고, 이를 전문가가 점검하여 68개 유형을 가진 사건구조프레임 목록(ESF-list)으로 최종 분류하여, 상기 워드넷의 2431개 동사의 신셋 24,601개가 각각 상기 68개 ESF-list 유형 중 하나에 연결되도록 상기 2431개 동사의 신셋 24,601개 각각을 해당 동사, 해당 신셋번호, 해당 오프셋 번호, 해당 사건구조프레임 유형을 포함하는 포맷으로 주석한, 68개의 사건구조프레임 유형을 가진 언어자원인,자동 주석방법
3 3
제 1항에 있어서,상기 사건구조프레임은, 하나의 동사가 지시하는 사건을 시간적 순서를 가진 복수개의 하위사건으로 구성하고, 상기 복수개의 하위사건은 전 상태, 진행 상태, 및 후 상태를 나타내는, 자동 주석방법
4 4
제 1항에 있어서,상기 논항 삽입 알고리즘은,상기 출력된 의미역을 사건구조프레임의 각 하위사건 해당 위치에 삽입하는,자동 주석방법
5 5
제 1항에 있어서,상기 시간순서 해당 동사는, 불규칙 굴절 동사 사전에서 추출된 불규칙 동사 및 동사굴절 알고리즘을 적용한 동사의 과거분사형, 현재분사형을 포함하는, 자동 주석방법
6 6
프로세서 및 메모리를 포함하는 언어처리 시스템에서, 입력 문장을 사건구조프레임(ESF)이 주석된 문장으로 출력하는 자동 주석 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능 저장매체로, 상기 저장매체는:상기 언어처리 시스템에 의해, 동사를 포함하는 영어 문장을 입력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 입력된 영어 문장에서 동사를 추출하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 사전 정의된 사건구조프레임 유형(Event Structure Frame type)과 그에 따른 동사를 분류하는 사건구조프레임 목록(ESF-list)을 구비하고, 영어 단어의 유의어 집단인 신셋(SynSet)을 포함하는 언어자원인 사건구조프레임 주석 워드넷(Event Structure Frame-annotated WordNet: ESFWN)에 연결하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 추출된 동사에 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘을 이용하여 상기 동사의 신셋과 연결되는 아이디인 오프셋을 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 오프셋을 이용하여 상기 ESFWN에서 상기 동사의 사건구조프레임 유형을 찾아 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 사건구조프레임 유형(Event Structure Frame type)에 해당하는 사건구조프레임(ESF)을 사건구조프레임 목록(ESF-List)에서 찾아 출력하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 상기 출력된 동사의 사건구조프레임에서 시간순서를 가진 각각에 시간순서 해당 동사를 삽입하도록 프로그램된 코드 부분;상기 언어처리 시스템에 의해, 의미역 라벨러(Semantic Role Labeler)에 연결하도록 프로그램된 코드 부분; 상기 언어처리 시스템에 의해, 상기 입력된 영어문장에 의미역 라벨링 알고리즘을 적용하여 동사 고유의 특성에 따라 구성성분이 갖는 의미상 역할인 의미역을 출력하도록 프로그램된 코드 부분; 상기 언어처리 시스템에 의해, 논항 삽입 알고리즘을 이용하여 상기 출력된 의미역 해당 텍스트를 사건구조프레임의 각 논항 위치에 삽입하도록 프로그램된 코드 부분; 및상기 언어처리 시스템에 의해, 상기 논항이 삽입된 동사중심 사건구조 문장을 출력하도록 프로그램된 코드 부분을 포함하고, 상기 단어 중의성 해소(Word Sense Disambiguation: WSD) 알고리즘은 EWISER 또는 EWISER-Wrapper이며,상기 의미역 라벨링 알고리즘은 AllenNLP SRL인, 컴퓨터 판독가능 저장매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 혁신성장동력프로젝트(과기정통부) (세부2) 비디오 이해를 위한 이벤트-상황 지식체계 학습 및 이벤트인식/관계추론 기술 개발