맞춤기술찾기

이전대상기술

기계학습 방법론을 이용한 한국 표준 산업/직업 분류 방법

  • 기술번호 : KST2022006026
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 기계학습 방법론을 이용한 한국 표준 산업/직업 분류 방법이 개시된다. 이 방법은 컴퓨터 장치에서 실행되는 컴퓨터 프로그램을 이용하여 수행되는 방법으로서, 통계조사로부터 수집된 인구 및 고용조사 입력 정보를 한국표준산업 코드로 자동으로 분류하기 위해 기계학습 기반의 방법론을 적용한다. 기존의 규칙 기반의 자동 코딩 시스템의 정확도 및 성능 보완과 효율적인 분류 시스템 개발을 위해 딥러닝 지도학습 기반의 분류 모델을 도입하고 자연어처리 기반의 텍스트 추론 기술을 이용하여 입력과 분류항목 간의 유사성을 분석한다. 이를 위해, 본 발명은 통계조사 자료의 다양한 자연어 입력의 산업/직업 분류 기술에 있어서, 응용 도메인과 학습 말뭉치에 특화해서 비지도 학습 기반으로 색인어를 추출하는 단계; 상기 단문 분류를 위한 단어 및 문장 임베딩 모델을 학습하는 단계; 및 학습된 사전학습 언어모델을 이용하여 지도학습기반 분류모델 학습 및 이용 단계를 포함한다.
Int. CL G06F 16/35 (2019.01.01) G06F 40/237 (2020.01.01) G06F 40/205 (2020.01.01) G06F 40/268 (2020.01.01) G06N 3/08 (2006.01.01) G06N 20/00 (2019.01.01)
CPC
출원번호/일자 1020210158896 (2021.11.17)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2022-0068937 (2022.05.26) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200155547   |   2020.11.19
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.11.17)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최호진 대전광역시 유성구
2 오교중 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박영우 대한민국 서울특별시 강남구 논현로 ***, *층 **세기특허법률사무소 (역삼동, 세일빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.11.17 수리 (Accepted) 1-1-2021-1328820-67
2 공지예외적용주장 증명서류 제출기한 안내문
2021.11.25 발송처리완료 (Completion of Transmission) 1-5-2021-0184686-60
3 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2021.12.01 수리 (Accepted) 1-1-2021-1390724-70
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
컴퓨터 장치에서 실행되는 컴퓨터 프로그램을 이용하여 수행되는 방법으로서, 통계조사 자료인 다양한 자연어로 된 산업/직업 정보를 입력받아 한국표준산업 코드로 자동으로 분류하기 위해, 응용 도메인과 학습 말뭉치에 특화해서 비지도 학습 기반으로 색인어를 추출하는 단계;추출된 색인어의 사전 지식을 이용하여, 단문 분류를 위한 단어 및 문장 임베딩 모델을 학습하는 단계; 및학습된 사전학습 언어모델을 이용하여 지도학습기반 분류모델 학습 및 이용 단계를 포함하여 통계조사로부터 수집된 정보를 한국표준 산업 코드로 자동 분류하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
2 2
제1항에 있어서, 상기 비지도 학습 기반으로 색인어를 추출하는 단계는,응용 도메인에 특화된 원시 말뭉치를 전처리하는 단계; 초/중/종성으로 분리하여, 자주 반복되는 부분단어들의 통계적인 정보를 활용하여, 응용 도메인 말뭉치 분석에 특화된 토크나이저를 구현하는 단계; 및 비지도 학습 기반으로 색인어 지식을 추출하는 단계를 포함하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
3 3
제2항에 있어서, 상기 토크나이저의 구현은 주어진 말뭉치에서 빈번히 결합하여 사용된 음절(글자) 패턴을 학습하여 복합어 및 개체명의 경계를 자동으로 학습하는 방식으로 이루어지는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
4 4
제1항에 있어서, 상기 단문 분류를 위한 단어 및 문장 임베딩 모델을 학습하는 단계는, 색인어 사전 지식과 응용 도메인에 특화된 개체명, 복합어를 결합시키는 토크나이저가 적용되어 주어진 입력 문장에서 경계를 찾고, 전처리된 응용 도메인특화 원시 말뭉치로부터 사전학습 언어모델을 학습하는 단계를 포함하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
5 5
제4항에 있어서, 부분단어(Subword) 임베딩을 단문에 적합한 문장 임베딩 방법으로 적용하기 위해 부분단어(Subword) 임베딩 모델을 언어모델 학습 위한 방법으로 사용하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
6 6
제4항에 있어서, 상기 단문 분류를 위한 단어 및 문장 임베딩 모델을 학습하는 단계는, 입력 데이터를 분석하여 그 입력 데이터에 포함된 전각자 및 반각자를 이 둘 중 어느 한 가지로 통일하는 작업, 비식별 정보의 정규화 처리와 같은 전처리를 수행하는 단계를 더 포함하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
7 7
제1항에 있어서, 상기 지도학습기반 분류모델 학습 및 이용 단계는, 학습된 사전학습 언어모델과 기존 통계조사의 입력과 분류 결과를 딥러닝 모델과 같은 지도학습 분류 모델을 통해 학습하여 산업/직업 분류 모델을 구현하는 단계; 및 새로운 통계조사 자료의 입력을 상기 산업/직업 분류 모델에 기반하여 분류 결과를 제공하는 단계를 포함하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
8 8
제7항에 있어서, 상기 지도학습기반 분류모델 학습 및 이용 단계는, 입력 데이터를 분석하여 그 입력 데이터에 포함된 전각자 및 반각자를 이 둘 중 어느 한 가지로 통일하는 작업, 비식별 정보의 정규화 처리와 같은 전처리를 수행하는 단계; 및 동의어 정보를 학습하여 입력문장에 대한 문장 임베딩을 수행하는 임베딩 단계를 더 포함하는 것을 특징으로 하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
9 9
제8항에 있어서, 상기 문장 임베딩을 수행함에 있어서 문장 단위의 학습을 수행할 수 있도록 입력 문장의 길이에 비례하여 임베딩 벡터를 업데이트하는 것을 특징으로 하는 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법
10 10
제1항 내지 제9항 중 어느 한 항에 기재된 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법을 수행하기 위하여 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 실행가능 프로그램
11 11
제1항 내지 제9항 중 어느 한 항에 기재된 기계학습 방법론을 이용한 한국표준 산업/직업분류 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정보통신.방송 연구개발사업 (엑소브레인-총괄/1세부)휴먼 지식증강 서비스를 위한지능진화형 WiseQA 플랫폼 기술 개발(2020)