맞춤기술찾기

이전대상기술

한국어 문서-수준 관계 추출 데이터셋 구축 장치 및 방법

  • 기술번호 : KST2024000369
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 한국어 문서-수준 관계 추출을 위한 데이터셋 생성 장치 및 방법과 생성된 데이터셋을 이용하여 한국어 문서-수준 관계 추출 모델을 생성하는 장치 및 방법이 개시된다. 상기 데이터셋 생성 방법은 프로세서(processor)를 포함하는 컴퓨팅 장치에 의해 수행되는 한국어 문서-수준 관계 추출(Korean Document-Level Relation Extraction)을 위한 데이터셋 생성 방법으로써, 문서를 획득하는 단계, 문서에 포함된 복수의 문장들 중 적어도 하나의 문장에 문서의 제목(title)을 주어로써 삽입하는 단계, 주어가 삽입된 문서 내의 개체명을 인식하는 단계, 문장-수준 관계 추출(Sentence-Level Relation Extraction)을 수행하는 단계, 및 문서-수준 관계 추출을 수행하는 단계를 포함한다.
Int. CL G06F 40/295 (2020.01.01) G06F 40/211 (2020.01.01) G06N 3/08 (2023.01.01) G06N 5/02 (2023.01.01)
CPC G06F 40/295(2013.01) G06F 40/211(2013.01) G06N 3/08(2013.01) G06N 5/022(2013.01)
출원번호/일자 1020230053598 (2023.04.24)
출원인 고려대학교 산학협력단
등록번호/일자 10-2621869-0000 (2024.01.02)
공개번호/일자
공고번호/일자 (20240105) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2023.04.24)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 임희석 서울특별시 성북구
2 손수현 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 김등용 대한민국 서울시 구로구 디지털로**길 **, ***호(구로동, 코오롱싸이언스밸리*차)(동진국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2023.04.24 수리 (Accepted) 1-1-2023-0460750-78
2 [우선심사신청]심사청구서·우선심사신청서
2023.04.28 수리 (Accepted) 1-1-2023-0479012-35
3 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2023.05.15 수리 (Accepted) 9-1-9999-9999999-89
4 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2023.05.16 수리 (Accepted) 9-1-2023-0010166-90
5 의견제출통지서
Notification of reason for refusal
2023.07.31 발송처리완료 (Completion of Transmission) 9-5-2023-0693546-15
6 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2023.09.14 수리 (Accepted) 1-1-2023-1020969-95
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.10.04 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-1084720-12
8 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.10.04 수리 (Accepted) 1-1-2023-1084699-40
9 등록결정서
Decision to grant
2023.12.14 발송처리완료 (Completion of Transmission) 9-5-2023-1126402-29
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
프로세서(processor)를 포함하는 컴퓨팅 장치에 의해 수행되는 한국어 문서-수준 관계 추출(Korean Document-Level Relation Extraction)을 위한 데이터셋 생성 방법에 있어서,문서를 획득하는 단계;문서에 포함된 복수의 문장들 중 적어도 하나의 문장에 문서의 제목(title)을 주어로써 삽입하는 단계;주어가 삽입된 문서 내의 개체명을 인식하는 단계;문장-수준 관계 추출(Sentence-Level Relation Extraction)을 수행하는 단계; 및문서-수준 관계 추출을 수행하는 단계를 포함하고,상기 주어로써 삽입하는 단계는, 상기 복수의 문장들 각각에 주어가 생략되어 있는지 여부를 판단하는 단계; 및 상기 복수의 문장들 중에서 주어가 생략된 문장에만 주어를 삽입하는 단계를 포함하고,상기 문서-수준 관계 추출을 수행하는 단계는, 삽입된 주어를 삭제하는 단계; 및 삭제된 주어와 연관된 관계를 문서 내에 존재하고 삭제된 주어와 동일한 엔티티와의 관계로 재할당하는 단계를 포함하는,데이터셋 생성 방법
2 2
제1항에 있어서,상기 문서는 상기 문서의 제목에 해당하는 주제에 대한 설명인 상기 복수의 문장들을 포함하는 백과사전 문서인,데이터셋 생성 방법
3 3
삭제
4 4
제1항에 있어서,상기 개체명을 인식하는 단계는 사전학습된 개체명 인식 모델을 이용하여 수행되고, 인식된 개체명-유형에 대한 주석을 생성하는,데이터셋 생성 방법
5 5
제4항에 있어서,상기 주어가 생략되어 있는지 여부를 판단하는 단계는 사전학습된 의존 구문 분석기(dependency parser)를 이용하여 수행되는,데이터셋 생성 방법
6 6
삭제
7 7
제1항에 있어서,획득된 문서, 적어도 하나의 엔티티 쌍, 및 상기 적어도 하나의 엔티티 쌍 각각에 대한 관계를 포함하는 상기 데이터셋을 생성하는 단계를 더 포함하는,데이터셋 생성 방법
8 8
제7항에 있어서,상기 데이터셋을 이용하여 사전학습된 언어 모델(Pre-trained Language Model, PLM)을 학습시킴으로써 문서-단위 관계 추출 모델을 생성하는 단계를 더 포함하는,데이터셋 생성 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.