맞춤기술찾기

이전대상기술

정형 데이터와 연관된 비정형 텍스트 데이터 연결 장치 및 방법

  • 기술번호 : KST2015092044
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 정형화된 데이터에 연관된 비정형 데이터 연결 장치로, 정형화된 데이터를 자원 서술 체계 형태의 정형데이터로 변환하고, 이를 분석하여 상기 정형 데이터로부터 키워드를 추출하는 정형화 데이터 키워드 추출부와, 상기 정형 데이터 키워드 추출부에 의해 추출된 키워드를 기반으로 정형 데이터와 연관성이 있는 비정형 텍스트 데이터 집합을 수집하는 비정형 텍스트 데이터 수집부와, 상기 수집된 비정형 텍스트 데이터 집합에서 주제어 용어집을 기반으로 비정형 텍스트 데이터의 문맥을 추출하고, 추출된 문맥을 기반으로 역인덱스를 생성하고, 정형 데이터와 비정형 데이터를 의미적으로 연결하는 데이터 연결부를 포함한다.
Int. CL G06F 17/20 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01) G06F 17/00(2013.01)
출원번호/일자 1020130130315 (2013.10.30)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2015-0049580 (2015.05.08) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.10.20)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박원주 대한민국 대전 유성구
2 이경하 대한민국 대전광역시 서구
3 조기성 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.10.30 수리 (Accepted) 1-1-2013-0987600-53
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2014.05.07 수리 (Accepted) 1-1-2014-0430493-80
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
4 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2015.10.20 수리 (Accepted) 1-1-2015-1017021-91
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.10.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-1017022-36
6 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2016.09.27 수리 (Accepted) 1-1-2016-0937944-41
7 의견제출통지서
Notification of reason for refusal
2016.11.21 발송처리완료 (Completion of Transmission) 9-5-2016-0837444-58
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.01.20 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-0071742-92
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.01.20 수리 (Accepted) 1-1-2017-0071739-54
10 거절결정서
Decision to Refuse a Patent
2017.05.19 발송처리완료 (Completion of Transmission) 9-5-2017-0352043-01
11 [명세서등 보정]보정서(재심사)
Amendment to Description, etc(Reexamination)
2017.06.14 보정승인 (Acceptance of amendment) 1-1-2017-0568840-81
12 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.06.14 수리 (Accepted) 1-1-2017-0568839-34
13 등록결정서
Decision to Grant Registration
2017.06.30 발송처리완료 (Completion of Transmission) 9-5-2017-0456913-13
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
정형화된 데이터를 자원 서술 체계 형태의 정형데이터로 변환하고, 이를 분석하여 상기 자원 서술 체계 형태의 정형 데이터로부터 키워드를 추출하는 정형 데이터 키워드 추출부와, 상기 정형 데이터 키워드 추출부에 의해 추출된 키워드를 기반으로 상기 자원 서술 체계 형태의 정형 데이터와 연관성이 있는 비정형 텍스트 데이터 집합을 수집하는 비정형 텍스트 데이터 수집부와, 상기 수집된 비정형 텍스트 데이터 집합에서 주제어 용어집을 기반으로 비정형 텍스트 데이터의 문맥을 추출하고, 추출된 문맥을 기반으로 역인덱스를 생성하고, 상기 자원 서술 체계 형태의 정형 데이터와 비정형 데이터를 의미적으로 연결하는 비정형 텍스트 데이터 의미 연결부를 포함함을 특징으로 하는 정형화된 데이터에 연관된 비정형 데이터 연결 장치
2 2
제 1항에 있어서, 상기 정형 데이터 키워드 추출부는 상기 자원 서술 체계 형태의 정형 데이터에 포함된 문장의 끝을 표시하는 구두점을 뺀 나머지 구두점들을 제거하는 텍스트 전처리부와, 상기 텍스트 전처리부를 통하여 출력된 텍스트 데이터 형태의 정형 데이터를 형태소 단위로 분석한 후, 각 형태소의 품사와 함께 출력하는 형태소 분석부와, 상기 형태소 분석된 데이터 문서 안에서 두 개 이상의 형태소를 붙여 하나의 키워드로 추출하는 키워드 추출부를 포함함을 특징으로 하는 비정형 데이터 연결 장치
3 3
제 2항에 있어서, 상기 텍스트 전처리부는 상기 자원 서술 체계 형태의 정형 데이터에서 이모티콘과 같은 특수 문자를 제거하고, 의미적 연결을 수행하는 언어 외의 외국어는 제거함을 특징으로 하는 비정형 데이터 연결 장치
4 4
제 1항에 있어서, 상기 정형 데이터 키워드 추출부는일반명사나 고유명사에서 문서의 도메인과 관계없는 불용어 리스트를 참고하여, 패턴에 의해 추출된 키워드 리스트에서 불용어를 제거하는 불용어 제거부를 더 포함함을 특징으로 하는 비정형 데이터 연결 장치
5 5
제 1항에 있어서, 상기 비정형 텍스트 데이터 의미 연결부는상기 비정형 데이터에 포함된 문장의 끝을 표시하는 구두점을 뺀 나머지 구두점들을 제거하는 텍스트 전처리부와, 상기 텍스트 전처리부를 통하여 출력된 텍스트 데이터 형태의 비정형 데이터를 형태소 단위로 분석한 후, 각 형태소의 품사와 함께 출력하는 형태소 분석부와, 일반명사나 고유명사에서 문서의 도메인과 관계없는 불용어 리스트를 참고하여, 패턴에 의해 추출된 키워드 리스트에서 불용어를 제거하는 불용어 제거부와, 수집된 비정형 텍스트 데이터 집합을 주제어 용어집(Corpus)을 기초로 각 비정형 텍스트 문서의 문맥을 추출할 때, 상기 비정형 텍스트 문서에서 주제어가 출현된 빈도수, 상기 비정형 텍스트 문서의 길이, 주제어가 출현한 비정형 텍스트 문서의 수 및 상기 비정형 텍스트 문서가 포함한 주제어의 수에 따라 가중치를 차별화하여 계산하는 주제어 빈도 가중치 계산부와, 상기 주제어 빈도 가중치 계산부의 연산 결과에 따라 수집된 비정형 텍스트 데이터의 문맥을 추출하는 비정형 텍스트 데이터 문맥 추출부와, 상기 자원 서술 체계 형태의 정형 데이터와 비정형 텍스트 데이터를 상기 자원 서술 체계 형태의 정형 데이터의 키워드를 중심으로 비정형 텍스트 데이터 문맥 역인덱스를 생성하고 저장하는 역인덱스 생성부와, 자원 서술 체계로 저장된 정형 데이터를 문맥이 추출된 비정형 텍스트와 주제어로 연결하는 문맥 기반 의미 연결 생성부와, 주제어를 중심으로 역인덱스 파일이 생성된 비정형 텍스트 데이터를 응용 서비스 목적에 따라 랭킹을 계산하는 응용 서비스 제공 랭킹 게산부를 포함함을 특징으로 하는 비정형 데이터 연결 장치
6 6
제 5항에 있어서, 상기 형태소 분석부는각 형태소의 품사와 함께 출력하는 비정형 텍스트 데이터의 처리함에 있어, 웹 데이터에서 빈번하게 나타나는 신조어, 통신 용어를 포함하는 사용자 사전을 추가하여 형태소를 분석함을 특징으로 하는 비정형 데이터 연결 장치
7 7
정형화된 데이터를 자원 서술 체계 형태의 정형데이터로 변환하고, 이를 분석하여 상기 자원 서술 체계 형태의 정형 데이터로부터 키워드를 추출하는 단계와, 상기 자원 서술 체계 형태의 정형 데이터로부터 키워드를 추출하는 단계에서 추출된 키워드를 기반으로 상기 자원 서술 체계 형태의 정형 데이터와 연관성이 있는 비정형 텍스트 데이터 집합을 수집하는 단계와, 상기 수집된 비정형 텍스트 데이터 집합에서 주제어 용어집을 기반으로 비정형 텍스트 데이터의 문맥을 추출하고, 추출된 문맥을 기반으로 역인덱스를 생성하고, 상기 자원 서술 체계 형태의 정형 데이터와 비정형 데이터를 의미적으로 연결하는 단계를 포함함을 특징으로 하는 정형화된 데이터에 연관된 비정형 데이터 연결 방법
8 8
제 7항에 있어서, 상기 자원 서술 체계 형태의 정형 데이터로부터 키워드를 추출하는 단계는상기 자원 서술 체계 형태의 정형 데이터에 포함된 문장의 끝을 표시하는 구두점을 뺀 나머지 구두점들을 제거하는 단계와, 상기 제거하는 단계를 통하여 출력되는 텍스트 데이터 형태의 정형 데이터를 형태소 단위로 분석한 후, 각 형태소의 품사와 함께 출력하는 단계와, 상기 형태소 분석된 데이터 문서 안에서 두 개 이상의 형태소를 붙여 하나의 키워드로 추출하는 단계 포함함을 특징으로 하는 비정형 데이터 연결 방법
9 9
제 8항에 있어서, 상기 자원 서술 체계 형태의 정형 데이터로부터 키워드를 추출하는 단계는일반명사나 고유명사에서 문서의 도메인과 관계없는 불용어 리스트를 참고하여, 패턴에 의해 추출된 키워드 리스트에서 불용어를 제거하는 단계를 더 포함함을 특징으로 하는 비정형 데이터 연결 방법
10 10
제 7항에 있어서, 상기 연결하는 단계는상기 비정형 데이터에 포함된 문장의 끝을 표시하는 구두점을 뺀 나머지 구두점들을 제거하는 단계와, 상기 제거하는 단계를 통해 출력되는 텍스트 데이터 형태의 비정형 데이터를 형태소 단위로 분석한 후, 각 형태소의 품사와 함께 출력하는 단계와, 일반명사나 고유명사에서 문서의 도메인과 관계없는 불용어 리스트를 참고하여, 패턴에 의해 추출된 키워드 리스트에서 불용어를 제거하는 단계와, 수집된 비정형 텍스트 데이터 집합을 주제어 용어집(Corpus)을 기초로 각 비정형 텍스트 문서의 문맥을 추출할 때, 상기 비정형 텍스트 문서에서 주제어가 출현된 빈도수, 상기 비정형 텍스트 문서의 길이, 주제어가 출현한 비정형 텍스트 문서의 수 및 상기 비정형 텍스트 문서가 포함한 주제어의 수에 따라 가중치를 차별화하여 계산하는 단계와, 상기 가중치 계산 결과에 따라 수집된 비정형 텍스트 데이터의 문맥을 추출하는 단계와, 상기 자원 서술 체계 형태의 정형 데이터와 비정형 텍스트 데이터를 상기 자원 서술 체계 형태의 정형 데이터의 키워드를 중심으로 비정형 텍스트 데이터 문맥 역인덱스를 생성하고 저장하는 단계와, 자원 서술 체계로 저장된 정형 데이터를 문맥이 추출된 비정형 텍스트와 주제어로 연결하는 단계와, 주제어를 중심으로 역인덱스 파일이 생성된 비정형 텍스트 데이터를 응용 서비스 목적에 따라 랭킹을 계산하는 단계를 포함함을 특징으로 하는 비정형 데이터 연결 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 한국전자통신연구원 방송통신원천기술개발사업 빅데이터 활용을 위한 지식 자산(Knowledge Base) 구축 및 실시간 Linked Data 응용기술 개발