맞춤기술찾기

이전대상기술

한국어 조사 변경을 통한 한국어 개체명 인식 모델의 학습 데이터 증강 방법

  • 기술번호 : KST2022023081
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 한국어 개체명 인식 작업에 사용되는 초기 학습 데이터셋을 이용하여 한국어 조사와 개체명 카테고리 간의 상관관계를 분석하여 상호 간의 의존성을 분석한다. 의존성 분석 결과에 기초하여, 각 개체명 카테고리에 강한 의존성을 갖는 조사들을 해당 개체명 카테고리에 약한 의존성을 갖는 조사들로 변경하여 한국어 조사와 개체명 카테고리간의 의존성이 완화된 변형 학습 데이터셋을 생성한다. 생성된 변형 학습 데이터셋을 상기 초기 학습 데이터셋에 추가하여 증강된 학습 데이터셋을 생성한다. 증강된 학습 데이터셋을 이용하여 개체명 인식 모델을 재학습할 수 있다. 본 발명을 이용하면, 학습 데이터를 새로 수집하지 않아도, 기존의 학습 데이터를 이용하여 학습 데이터를 의존성을 완화하는 방향으로 증강할 수 있으며, 개체명 인식 작업에 대한 성능 향상까지 도모할 수 있다.
Int. CL G06F 40/295 (2020.01.01) G06F 40/268 (2020.01.01) G06N 20/00 (2019.01.01)
CPC G06F 40/295(2013.01) G06F 40/268(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020220067174 (2022.05.31)
출원인 한국과학기술원, 주식회사 네비웍스
등록번호/일자
공개번호/일자 10-2022-0162097 (2022.12.07) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020210070378   |   2021.05.31
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.05.31)
심사청구항수 9

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
2 주식회사 네비웍스 대한민국 경기도 안양시 동안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최호진 대전광역시 유성구
2 이녕우 대전광역시 유성구
3 원준희 경기도 안양시 동안구
4 구본홍 경기도 안양시 동안구
5 윤성열 경기도 안양시 동안구
6 최형균 경기도 안양시 동안구
7 이성후 경기도 안양시 동안구
8 심현우 경기도 안양시 동안구
9 김보라 경기도 안양시 동안구
10 이정욱 경기도 안양시 동안구
11 남제현 경기도 안양시 동안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박영우 대한민국 서울특별시 강남구 논현로 ***, *층 **세기특허법률사무소 (역삼동, 세일빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.05.31 수리 (Accepted) 1-1-2022-0577587-07
2 보정요구서
Request for Amendment
2022.06.08 발송처리완료 (Completion of Transmission) 1-5-2022-0085647-80
3 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.07.04 수리 (Accepted) 1-1-2022-0692507-85
4 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.07.07 수리 (Accepted) 1-1-2022-0707193-83
5 선행기술조사의뢰서
Request for Prior Art Search
2022.10.18 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
한국어 개체명 인식 작업에 사용하는 초기 학습 데이터셋을 이용해 한국어 조사와 개체명 카테고리 간의 상관관계를 분석하여 상호 간의 의존성을 분석하는 단계;의존성 분석 결과에 기초하여, 각 개체명 카테고리에 강한 의존성을 갖는 조사들을 해당 개체명 카테고리에 약한 의존성을 갖는 조사들로 변경하여 한국어 조사와 개체명 카테고리간의 의존성이 완화된 변형 학습 데이터셋을 생성하는 단계; 및 생성된 변형 학습 데이터셋을 상기 초기 학습 데이터셋에 추가하여 증강된 학습 데이터셋을 생성하는 단계를 포함하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
2 2
제 1항에 있어서, 상기 증강된 학습 데이터셋을 이용하여 개체명 인식 모델을 재학습시키는 단계를 더 포함하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
3 3
제 1 항에 있어서, 상기 의존성을 분석하는 단계는 상기 초기 학습 데이터셋 내의 각 문장별로 그 문장의 각 어절에 대한 개체명 카테고리를 파악하는 단계; 및 파악된 각 개체명 카테고리별로 그 개체명 카테고리에 강한 의존성을 갖는 조사들과 약한 의존성을 갖는 조사들을 도출하는 단계를 포함하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
4 4
제 3항에 있어서, 상기 의존성의 강약은 각 개체명 카테고리별로 함께 사용된 조사들의 빈도를 구하고 그 구해진 빈도가 제1 문턱값 이상이면 의존성이 강한 조사로 판별하고, 제2 문턱값 이하이면 의존성이 약한 조사로 판별하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
5 5
제 1항에 있어서, 상기 변형 학습 데이터셋을 생성하는 단계는, 상기 초기 학습 데이터셋에서 각 문장에 포함되어 있는 특정 개체명 카테고리와 의존성이 강한 조사를 의존성이 약한 조사로 대체하여 의존성이 완화된 변경된 문장들을 생성하는 단계; 및 상기 변경된 문장들을 포함하는 상기 변형 학습 데이터셋을 생성하는 단계를 포함하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
6 6
제 1 항에 있어서, 상기 변형 학습 데이터셋을 생성하는 단계에서, 특정 개체명 카테고리에 강한 의존성을 갖는 조사들 중에서 다른 개체명 카테고리와도 강한 의존성을 갖는 조사는 약한 의존성을 갖는 조사로 변경할 대상에서 제외하는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
7 7
제 1항에 있어서, 상기 한국어 조사와 개체명 간의 상관관계 분석은 한국어 형태소 분석기를 사용하여 수행되는 것을 특징으로 하는 한국어 개체명 인식 모델의 학습 데이터 증강 방법
8 8
제1항 내지 제7항 중 어느 하나에 기재된 한국어 개체명 인식 모델의 학습 데이터 증강 방법을 수행하기 위하여 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 실행가능 프로그램
9 9
제1항 내지 제7항 중 어느 하나에 기재된 한국어 개체명 인식 모델의 학습 데이터 증강 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통상자원부 KAIST 산업체연구개발사업 (G01200365)멀티에이전트 군사훈련 인공지능기술연구개발(2020년도)