맞춤기술찾기

이전대상기술

문서의 색인화 및 검색을 위한 방법 및 장치

  • 기술번호 : KST2014042961
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 전자화된 문서를 구성요소별로 구분하고, 상기 구성요소 중에서 당해 문서의 색인화를 위한 최소 단위를 선택하며, 상기 문서 및 상기 문서의 각 구성요소에 대해 고유 번호를 부여하고 키워드를 추출한다. 또한, 각 구성요소에 대해 구성요소 벡터를 구성하고, 각 구성요소에 대해 구성요소 미니 벡터도 구성한다. 질의문으로부터 질의 벡터 및 질의 미니 벡터를 구성하고, 질의 미니 벡터를 구성요소 미니 벡터와 비교하여 소정 개수의 구성요소들을 선택한 후에, 질의 벡터를 선택된 구성요소 벡터와 비교하여 구성요소들을 검색한다.
Int. CL G06F 17/21 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01)
출원번호/일자 1020090106952 (2009.11.06)
출원인 동국대학교 산학협력단
등록번호/일자 10-1136037-0000 (2012.04.05)
공개번호/일자 10-2011-0050106 (2011.05.13) 문서열기
공고번호/일자 (20120418) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.11.06)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 동국대학교 산학협력단 대한민국 서울특별시 중구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이용규 대한민국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 박국진 대한민국 서울특별시 강남구 언주로***, *층(논현동,시그너스빌딩)(두호특허법인)
2 노준태 대한민국 부산광역시 강서구 미음산단*로**번길**, *층***호(미음동,부산글로벌테크비즈센터)(두호특허법인(부산분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 주식회사 컴퓨웍스 서울특별시 금천구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.11.06 수리 (Accepted) 1-1-2009-0683489-01
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.11.05 수리 (Accepted) 4-1-2010-5206478-99
3 선행기술조사의뢰서
Request for Prior Art Search
2011.02.11 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2011.03.21 수리 (Accepted) 9-1-2011-0025990-10
5 의견제출통지서
Notification of reason for refusal
2011.04.13 발송처리완료 (Completion of Transmission) 9-5-2011-0198948-18
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.04.15 수리 (Accepted) 1-1-2011-0280372-20
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.04.15 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0280373-76
8 의견제출통지서
Notification of reason for refusal
2011.10.26 발송처리완료 (Completion of Transmission) 9-5-2011-0622957-09
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.12.06 수리 (Accepted) 1-1-2011-0968945-29
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.06 수리 (Accepted) 4-1-2011-5243351-46
11 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.12.06 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0968947-10
12 등록결정서
Decision to grant
2012.04.04 발송처리완료 (Completion of Transmission) 9-5-2012-0201759-92
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.10 수리 (Accepted) 4-1-2014-0002002-62
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.16 수리 (Accepted) 4-1-2019-5163486-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
색인화 최소 단위 선택부에 의해, 전자화된 문서를 구성요소별로 구분하고 상기 구성요소 중에서 당해 문서의 색인화를 위한 최소 단위를 선택하며, 고유 번호 부여부에 의해, 상기 문서 및 상기 문서의 각 구성요소에 대해 고유 번호를 부여하는 단계;키워드 추출부에 의해, 상기 각 구성요소에 대해 키워드를 추출하는 단계;단말 노드 벡터 구성부에 의해, 상기 각 구성요소 중 단말 노드에 대해 추출된 키워드를 포함하는 구성요소 벡터(즉, 단말 노드 벡터)를 구성하는 단계;비단말 노드 벡터 구성부에 의해, 상기 각 구성요소 중 비단말 노드에 대해 추출된 키워드를 포함하는 구성요소 벡터(즉, 비단말 노드 벡터)를 구성하는 단계;미니 벡터 구성부에 의해, 상기 단말 노드 벡터 및 상기 비단말 노드 벡터로부터 빈도가 높은 순서대로 기설정된 소정 개수의 키워드만을 포함하는 구성요소 미니 벡터를 각 구성요소마다 구성하는 단계; 및질의문 검색부에 의해, 질의문으로부터 질의 벡터 및 질의 미니 벡터를 구성하고, 상기 질의 미니 벡터를 상기 문서의 각 구성요소마다의 미니 벡터와 비교하여 소정 개수의 구성요소를 선택한 후에, 상기 질의 벡터를 상기 선택된 소정 개수의 구성요소 벡터와 비교하여 유사도를 결정함으로써, 구성요소를 검색하는 단계를 포함하는 색인화 및 검색 방법
2 2
제1항에 있어서,상기 색인화를 위한 최소 단위를 선택하는 단계는,문서를 세분화하여 트리 형태로 나타내어 각 부분을 노드화하고, 이를 기준으로 단말 노드 및 비단말 노드로 구분한 후, 각각의 단말 노드를 최소 단위로 선택하는 색인화 및 검색 방법
3 3
제1항에 있어서,상기 키워드를 추출하는 단계는,형태소 분석 기법을 이용하여 키워드를 추출하며, 금칙어 및 불용어를 필터링하며, 상기 키워드 뿐만 아니라 각각의 키워드에 대한 빈도도 추출하는 색인화 및 검색 방법
4 4
제1항에 있어서, 상기 비단말 노드 벡터를 구성하는 단계에서,상기 비단말 노드 nk에 대한 구성요소 벡터는, 당해 비단말 노드 nk의 하위에 있는 단말 노드들에 대한 단말 노드 벡터의 합,즉, 비단말 노드의 자손인 단말 노드가 t개 있고, 각 벡터를 Vj라 하면인 색인화 및 검색 방법
5 5
제1항에 있어서, 상기 구성요소 미니 벡터를 구성하는 단계는,상기 구성요소 미니 벡터로 구성할 키워드의 수 m을 미리 설정하는 단계;빈도가 높은 순서대로 m개의 키워드를 선정하여 모든 단말 노드 및 비단말 노드에 대해 구성요소 미니 벡터를 구성하는 단계; 및상기 구성요소 미니 벡터를 데이터베이스에 저장하는 단계를 포함하는 색인화 및 검색 방법
6 6
제1항에 있어서, 상기 구성요소를 검색하는 단계는,상기 질의문에 대해 키워드를 추출하여 질의 벡터를 구성하는 단계;상기 질의 벡터로부터 소정 개수의 키워드만을 선정하여 질의 미니 벡터를 구성하는 단계; 상기 질의 미니 벡터와 상기 구성요소 미니 벡터를 비교하여, 유사도가 높은 순으로 또는 유사도 수치가 소정 이상인 것으로 P개의 구성요소를 선택하는 단계; 및상기 질의 벡터와 상기 P개의 구성요소의 구성요소 벡터를 비교하여, 유사도가 높은 순으로 또는 유사도 수치가 소정 이상인 것으로 R개(단, R≤P)의 구성요소를 선택하는 단계를 포함하는 색인화 및 검색 방법
7 7
제6항에 있어서, 상기 P개의 구성요소를 선택하는 단계 및 상기 R개의 구성요소를 선택하는 단계에서,벡터들 사이의 유사도 비교 기법은, 불리언 모델, 확장 불리언 모델, 유클리디언 공식, 및 코사인 공식 중의 하나 이상의 기법을 이용하는 것을 포함하는 색인화 및 검색 방법
8 8
제6항에 있어서,상기 질의 미니 벡터와 상기 구성요소 미니 벡터를 비교하여 상기 P개의 구성요소를 선택하는 단계에서, 하나의 문서에서는 최대 하나씩의 구성요소만을 선정하도록 설정되는 색인화 및 검색 방법
9 9
제1항 내지 제8항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
10 10
전자화된 문서를 구성요소별로 구분하고, 상기 구성요소 중에서 당해 문서의 색인화를 위한 최소 단위를 선택하는 색인화 최소 단위 선택부;상기 문서 및 상기 문서의 각 구성요소에 대해 고유 번호를 부여하는 고유 번호 부여부;상기 각 구성요소에 대해 키워드를 추출하는 키워드 추출부;상기 각 구성요소 중 단말 노드에 대해 추출된 키워드를 포함하는 구성요소 벡터(즉, 단말 노드 벡터)를 구성하는 단말 노드 벡터 구성부;상기 각 구성요소 중 비단말 노드에 대해 추출된 키워드를 포함하는 구성요소 벡터(즉, 비단말 노드 벡터)를 구성하는 비단말 노드 벡터 구성부;상기 단말 노드 벡터 및 상기 비단말 노드 벡터로부터 빈도가 높은 순서대로 기설정된 소정 개수의 키워드만을 포함하는 구성요소 미니 벡터를 각 구성요소마다 구성하는 미니 벡터 구성부; 및질의문으로부터 질의 벡터 및 질의 미니 벡터를 구성하고, 상기 질의 미니 벡터를 상기 문서의 각 구성요소마다의 미니 벡터와 비교하여 소정 개수의 구성요소를 선택한 후에, 상기 질의 벡터를 상기 선택된 소정 개수의 구성요소 벡터와 비교하여 유사도를 결정함으로써, 구성요소를 검색하는 질의문 검색부를 포함하는 색인화 및 검색 장치
11 11
제10항에 있어서,상기 색인화 최소 단위 선택부는,문서를 세분화하여 트리 형태로 나타내어 각 부분을 노드화하고, 이를 기준으로 단말 노드 및 비단말 노드로 구분한 후, 각각의 단말 노드를 최소 단위로 선택하는 색인화 및 검색 장치
12 12
제10항에 있어서,상기 키워드 추출부는,형태소 분석 기법을 이용하여 키워드를 추출하며, 금칙어 및 불용어를 필터링하며, 상기 키워드 뿐만 아니라 각각의 키워드에 대한 빈도도 추출하는 색인화 및 검색 장치
13 13
제10항에 있어서, 상기 비단말 노드 벡터 구성부에서,상기 비단말 노드 nk에 대한 구성요소 벡터는, 당해 비단말 노드 nk의 하위에 있는 단말 노드들에 대한 단말 노드 벡터의 합,즉, 비단말 노드의 자손인 단말 노드가 t개 있고, 각 벡터를 Vj라 하면인 색인화 및 검색 장치
14 14
제10항에 있어서, 상기 미니 벡터 구성부는,상기 구성요소 미니 벡터로 구성할 키워드의 수 m을 미리 설정하고,빈도가 높은 순서대로 m개의 키워드를 선정하여 모든 단말 노드 및 비단말 노드에 대해 구성요소 미니 벡터를 구성하고,상기 구성요소 미니 벡터를 데이터베이스에 저장하는 색인화 및 검색 장치
15 15
제10항에 있어서, 상기 질의문 검색부는,상기 질의문에 대해 키워드를 추출하여 질의 벡터를 구성하고,상기 질의 벡터로부터 소정 개수의 키워드만을 선정하여 질의 미니 벡터를 구성하고,상기 질의 미니 벡터와 상기 구성요소 미니 벡터를 비교하여, 유사도가 높은 순으로 또는 유사도 수치가 소정 이상인 것으로 P개의 구성요소를 선택하고,상기 질의 벡터와 상기 P개의 구성요소의 구성요소 벡터를 비교하여, 유사도가 높은 순으로 또는 유사도 수치가 소정 이상인 것으로 R개(단, R≤P)의 구성요소를 선택하는 색인화 및 검색 장치
16 16
제15항에 있어서, 상기 P개의 구성요소 선택 및 상기 R개의 구성요소 선택에 있어서, 벡터들 사이의 유사도 비교 기법은, 불리언 모델, 확장 불리언 모델, 유클리디언 공식, 및 코사인 공식 중의 하나 이상의 기법을 이용하는 것을 포함하는 색인화 및 검색 장치
17 17
제15항에 있어서,상기 질의 미니 벡터와 상기 구성요소 미니 벡터를 비교하여 상기 P개의 구성요소를 선택함에 있어서, 하나의 문서에서는 최대 하나씩의 구성요소만을 선정하도록 설정되는 색인화 및 검색 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.