맞춤기술찾기

이전대상기술

단일 클래스 기반의 데이터 수집 장치 및 방법

  • 기술번호 : KST2018012463
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 실시예들은 키워드를 검색하여 추출한 문헌 자료 내에 포함된 용어를 벡터로 전처리하고, 전처리된 용어들을 바운더리 파라미터를 기반으로 학습하며, 비 라벨링 데이터 영역으로부터 라벨링 데이터 영역을 분리하는 경계를 검출하는 단일 클래스 분류 모델을 이용하여 문헌 자료 중에서 키워드와 관련된 유효 데이터를 추출함으로써, 색인어로 검색한 결과보다 키워드와의 관계에서 관련도가 높은 데이터를 다량으로 수집할 수 있으며, 특정 카테고리뿐만 아니라 다른 카테고리에 해당하는 텍스트 데이터라도 의미가 있는 텍스트 데이터를 추출할 수 있는 데이터 수집 장치 및 방법을 제공한다.
Int. CL G06F 17/30 (2006.01.01) G06F 17/27 (2006.01.01)
CPC G06F 16/35(2013.01) G06F 16/35(2013.01)
출원번호/일자 1020170028349 (2017.03.06)
출원인 연세대학교 산학협력단
등록번호/일자
공개번호/일자 10-2018-0101858 (2018.09.14) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2017.03.06)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 대한민국 서울특별시 서대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박상현 대한민국 서울특별시 서대문구
2 차준범 대한민국 서울특별시 서대문구
3 김정우 대한민국 서울특별시 서대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인우인 대한민국 서울특별시 강남구 역삼로 ***, *층(역삼동, 중평빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 연세대학교 산학협력단 서울특별시 서대문구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2017.03.06 수리 (Accepted) 1-1-2017-0222517-23
2 의견제출통지서
Notification of reason for refusal
2018.08.22 발송처리완료 (Completion of Transmission) 9-5-2018-0572472-13
3 [공지예외적용 보완 증명서류]서류제출서
2018.09.05 수리 (Accepted) 1-1-2018-0882526-71
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2018.09.05 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2018-0882550-67
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2018.09.05 수리 (Accepted) 1-1-2018-0882549-10
6 등록결정서
Decision to grant
2018.11.09 발송처리완료 (Completion of Transmission) 9-5-2018-0763986-93
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
컴퓨팅 디바이스에 의한 데이터 수집 방법에 있어서,데이터베이스에서 키워드로 검색하여 문헌 자료를 추출하는 단계;상기 추출한 문헌 자료를 파싱하는 단계;상기 문헌 자료 내에 포함된 용어의 중요도를 기준으로 상기 용어를 벡터로 표현하여 전처리하는 단계;상기 전처리한 용어들을 바운더리 파라미터를 기반으로 학습하며, 비 라벨링 데이터 영역으로부터 라벨링 데이터 영역을 분리하는 경계를 검출하는 단일 클래스 분류 모델을 생성하는 단계; 및상기 단일 클래스 분류 모델을 이용하여, 상기 문헌 자료 중에서 상기 키워드와 관련된 유효 데이터를 추출하는 단계를 포함하는 데이터 수집 방법
2 2
제1항에 있어서,상기 문헌 자료를 파싱하는 단계는 상기 문헌 자료를 식별자, 문헌 종류, 제목, 및 요약으로 구분하는 것을 특징으로 하는 데이터 수집 방법
3 3
제1항에 있어서,상기 단일 클래스 분류 모델은 분류하기 위하여 오답 집합에 속하는 네거티브 데이터를 학습하지 않고, 정답 집합에 속하는 포지티브 데이터를 학습하며, 상기 포지티브 데이터는 (i) 상기 키워드의 의미를 내포하는 색인어를 갖는 문헌, (ii) 상기 키워드의 의미를 내포하는 색인어를 갖지 않는 문헌, (ii) 상기 색인어를 갖지 않는 문헌 중 적어도 하나를 대상으로 하며,상기 키워드는 상기 문헌 자료의 텍스트 내용에 포함된 적어도 하나의 용어이고, 상기 색인어는 문서 검색을 목적으로 상기 문헌 자료와 미리 매칭된 별도의 통제어로서, 상기 키워드와 상기 색인어는 상기 데이터베이스에서 상기 문헌 자료를 추출하기 위해 각각 사용될 수 있는 것을 특징으로 하는 데이터 수집 방법
4 4
제3항에 있어서,상기 색인어는 상기 용어들의 계층 관계를 트리 구조로 형성하고, 연관어는 상기 색인어로 채택되지 않은 축약어, 단복수형, 유사어, 또는 동의어에 해당하고, 상기 연관어 및 상기 색인어 간에 상호 참조되며, 상기 연관어에 대응하는 상기 색인어로 대체되어 검색되는 것을 특징으로 하는 데이터 수집 방법
5 5
제1항에 있어서,상기 바운더리 파라미터는 상기 단일 클래스 분류 모델의 경계의 상한을 조절하며, 상기 바운더리 파라미터는 제1 바운더리 파라미터 또는 제2 바운더리 파라미터로 설정되며, 상기 제1 바운더리 파라미터는 상기 제2 바운더리 파라미터보다 큰 값으로 설정되는 것을 특징으로 하는 데이터 수집 방법
6 6
제5항에 있어서,상기 문헌 자료의 제목에 상기 키워드가 포함되면 상기 바운더리 파라미터는 상기 제1 바운더리 파라미터로 설정되고, 상기 문헌 자료의 제목에 키워드가 포함되지 않으면 상기 바운더리 파라미터는 상기 제2 바운더리 파라미터로 설정되는 것을 특징으로 하는 데이터 수집 방법
7 7
제1항에 있어서,상기 키워드 및 상기 문헌 자료 간의 관련도를 평가하는 단계를 추가로 포함하며, 정답 집합에 속하는 포지티브 데이터 및 오답 집합에 속하는 네거티브 데이터에 기반하여 정밀도를 산출하여 상기 관련도를 평가하는 것을 특징으로 하는 데이터 수집 방법
8 8
데이터베이스에서 키워드로 검색하여 문헌 자료를 추출하는 문헌 추출부;상기 추출한 문헌 자료를 파싱하는 문헌 파싱부;상기 문헌 자료 내에 포함된 용어의 중요도를 기준으로 상기 용어를 벡터로 표현하여 전처리하는 용어 전처리부;상기 전처리한 용어들을 바운더리 파라미터를 기반으로 학습하며, 비 라벨링 데이터 영역으로부터 라벨링 데이터 영역을 분리하는 경계를 검출하는 단일 클래스 분류 모델을 생성하는 분류 모델 생성부; 및상기 단일 클래스 분류 모델을 이용하여, 상기 문헌 자료 중에서 상기 키워드와 관련된 유효 데이터를 추출하는 유효 데이터 추출부를 포함하는 데이터 수집 장치
9 9
제8항에 있어서,상기 문헌 파싱부는, 상기 문헌 자료를 식별자, 문헌 종류, 제목, 및 요약으로 구분하는 것을 특징으로 하는 데이터 수집 장치
10 10
제8항에 있어서,상기 단일 클래스 분류 모델은 분류하기 위하여 오답 집합에 속하는 네거티브 데이터를 학습하지 않고, 정답 집합에 속하는 포지티브 데이터를 학습하며, 상기 포지티브 데이터는 (i) 상기 키워드의 의미를 내포하는 색인어를 갖는 문헌, (ii) 상기 키워드의 의미를 내포하는 색인어를 갖지 않는 문헌, (ii) 상기 색인어를 갖지 않는 문헌 중 적어도 하나를 대상으로 하며,상기 키워드는 상기 문헌 자료의 텍스트 내용에 포함된 적어도 하나의 용어이고, 상기 색인어는 문서 검색을 목적으로 상기 문헌 자료와 미리 매칭된 별도의 통제어로서, 상기 키워드와 상기 색인어는 상기 데이터베이스에서 상기 문헌 자료를 추출하기 위해 각각 사용될 수 있는 것을 특징으로 하는 데이터 수집 장치
11 11
제10항에 있어서,상기 색인어는 상기 용어들의 계층 관계를 트리 구조로 형성하고, 연관어는 상기 색인어로 채택되지 않은 축약어, 단복수형, 유사어, 또는 동의어에 해당하고, 상기 연관어 및 상기 색인어 간에 상호 참조되며, 상기 연관어에 대응하는 상기 색인어로 대체되어 검색되는 것을 특징으로 하는 데이터 수집 장치
12 12
제8항에 있어서,상기 바운더리 파라미터는 상기 단일 클래스 분류 모델의 경계의 상한을 조절하며, 상기 바운더리 파라미터는 제1 바운더리 파라미터 또는 제2 바운더리 파라미터로 설정되며, 상기 제1 바운더리 파라미터는 상기 제2 바운더리 파라미터보다 큰 값으로 설정되는 것을 특징으로 하는 데이터 수집 장치
13 13
제12항에 있어서,상기 문헌 자료의 제목에 상기 키워드가 포함되면 상기 바운더리 파라미터는 상기 제1 바운더리 파라미터로 설정되고, 상기 문헌 자료의 제목에 키워드가 포함되지 않으면 상기 바운더리 파라미터는 상기 제2 바운더리 파라미터로 설정되는 것을 특징으로 하는 데이터 수집 장치
14 14
제8항에 있어서,상기 키워드 및 상기 문헌 자료 간의 관련도를 평가하는 관련도 평가부를 추가로 포함하며, 상기 관련도 평가부는 정답 집합에 속하는 포지티브 데이터 및 오답 집합에 속하는 네거티브 데이터에 기반하여 정밀도를 산출하여 상기 관련도를 평가하는 것을 특징으로 하는 데이터 수집 장치
15 15
프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 비일시적(Non-Transitory) 컴퓨터 판독 가능한 매체에 기록되어 데이터 수집을 위한 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램 명령어들이 컴퓨팅 디바이스의 프로세서에 의해 실행되는 경우에,데이터베이스에서 키워드로 검색하여 문헌 자료를 추출하는 단계;상기 추출한 문헌 자료를 파싱하는 단계;상기 문헌 자료 내에 포함된 용어의 중요도를 기준으로 상기 용어를 벡터로 표현하여 전처리하는 단계;상기 전처리한 용어들을 바운더리 파라미터를 기반으로 학습하며, 비 라벨링 데이터 영역으로부터 라벨링 데이터 영역을 분리하는 경계를 검출하는 단일 클래스 분류 모델을 생성하는 단계; 및상기 단일 클래스 분류 모델을 이용하여, 상기 문헌 자료 중에서 상기 키워드와 관련된 유효 데이터를 추출하는 단계를 포함한 동작들을 수행하는 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 연세대학교 중견연구자지원사업 데이터마이닝 분석기법을 이용한 질병 모듈 탐색 및 질병 네트워크 구축에 관한 연구(2/3)(2015.5.1~2018.4.30)