맞춤기술찾기

이전대상기술

중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템 및그 방법

  • 기술번호 : KST2015178453
  • 담당센터 : 광주기술혁신센터
  • 전화번호 : 062-360-4654
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템 및 그 방법에 관한 것으로서, 질의 중심적인 초기검색문서집합에 대해서 중첩이 허용된 문서클러스터를 이용하여 문서들 사이의 관계를 반영하여 질의에 핵심역할을 하는 지배적 문서를 찾고, 이 문서들을 반복적으로 피드백하여 질의가 내포하는 핵심 주제를 강조하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템 및 그 방법에 관한 것이다. 상기와 같은 본 발명에 따르면, 중첩 클러스터를 이용하여 문서들 사이의 관계를 반영하고 상위검색 문서들을 재샘플링하여 피드백하는 것은 잠정적 적합 피드백에서 유효한 효과가 있고, 클러스터 형성에서 지배적 역할을 하는 문서를 반복해서 피드백 함으로써 확장된 질의는 원래(초기) 질의에 대한 핵심주제를 강조할 수 있는 효과가 있다. 중첩 클러스터, 재샘플링, 피드백 문서
Int. CL G06F 16/00 (2019.01.01) G06F 17/18 (2006.01.01)
CPC G06F 17/30687(2013.01) G06F 17/30687(2013.01) G06F 17/30687(2013.01) G06F 17/30687(2013.01) G06F 17/30687(2013.01)
출원번호/일자 1020090015484 (2009.02.24)
출원인 전북대학교산학협력단
등록번호/일자 10-1056412-0000 (2011.08.05)
공개번호/일자 10-2010-0096564 (2010.09.02) 문서열기
공고번호/일자 (20110811) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2009.02.24)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 전북대학교산학협력단 대한민국 전라북도 전주시 덕진구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이경순 대한민국 전라북도 전주시 덕진구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이은철 대한민국 서울특별시 송파구 법원로**길 **, A동 *층 ***호 (문정동, H비지니스파크)(*T국제특허법률사무소)
2 유완식 대한민국 서울특별시 강남구 테헤란로 ***, **층 *T 국제특허법률사무소 (역삼동, 여삼빌딩)(*T국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 전북대학교산학협력단 대한민국 전라북도 전주시 덕진구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2009.02.24 수리 (Accepted) 1-1-2009-0115029-01
2 선행기술조사의뢰서
Request for Prior Art Search
2010.03.04 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2010.04.16 수리 (Accepted) 9-1-2010-0025196-40
4 의견제출통지서
Notification of reason for refusal
2010.12.16 발송처리완료 (Completion of Transmission) 9-5-2010-0577945-71
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.12.28 수리 (Accepted) 4-1-2010-5245806-20
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.02.16 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0111074-11
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.02.16 수리 (Accepted) 1-1-2011-0111069-82
8 등록결정서
Decision to grant
2011.07.25 발송처리완료 (Completion of Transmission) 9-5-2011-0411412-45
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.10.04 수리 (Accepted) 4-1-2012-5206243-46
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.01.29 수리 (Accepted) 4-1-2016-5013206-34
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.02.27 수리 (Accepted) 4-1-2019-5038917-11
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.07.23 수리 (Accepted) 4-1-2019-5146986-17
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.07.23 수리 (Accepted) 4-1-2019-5146985-61
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.22 수리 (Accepted) 4-1-2019-5219602-91
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.07.06 수리 (Accepted) 4-1-2020-5149086-79
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템에 있어서, 질의를 입력받는 입력수단을 포함하고, 질의에 대한 검색 어휘에 따라 언어 모델 기반으로 웹 문서를 검색하는 웹 질의부(100); 상기 웹 질의부를 통해 검색된 문서집합에 대해 문서 유사도를 측정하고, 최근접 이웃 클러스터링을 수행하여 중첩 클러스터들을 생성하는 중첩 클러스터부(200); 상기 중첩 클러스터부에 의해 생성된 중첩 클러스터들의 순위를 클러스터기반 언어모델(수학식6)에 의해 정하고, 클러스터 기반 질의 확률 언어모델을 추정하는 클러스터 순위 산출부(300); (수학식 6) (여기서, qi는 i번째 질의 어휘, m은 질의Q의 어휘 개수이고, Clu는 클러스터) 상기 순위 산출부를 통해 최상위로 순위화된 클러스터에 속하는 각 문서에 대해 상기 질의에 대한 언어모델의 확률 P(Q|D)과 적합성 피드백 문서집합의 각 문서에서의 단어확률 P(w|D)를 곱한 것을 피드백 문서들 전체에 대해서 누적된 값이 가장 높은 것을 질의 확장 어휘로 선택하는 질의 확장부(400); 상기 질의 확장부에 의해 선택된 질의 확장 어휘를 상기 웹 질의부로 피드백 입력하는 피드백 처리부(500); 및 상기 웹 질의부, 중첩 클러스터부, 순위 산출부, 질의 확장부 및 피드백 처리부를 제어하는 제어부(700); 를 포함하는 것을 특징으로 하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템
2 2
제 1 항에 있어서, 상기 웹 질의부(100)는, 문서 그 자체를 언어 모델로서, 문서를 검색하고 언어모델로부터 질의를 생성 또는 샘플링할 확률에 의해서 순위화하는 문서검색 모듈(110); 및 상기 문서검색 모듈로부터 순위화되어 생성된 텍스트의 열로써, 최대확률 추정을 이용하여 문서 언어모델을 추정하는 질의 확률 검색모듈(120);을 포함하는 것을 특징으로 하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템
3 3
제 1 항에 있어서, 상기 중첩 클러스터부(200)는, 상기 문서의 각 어휘를 TF-IDF가중치로 계산한 후, 코사인 계수(cosine coefficient)를 이용하여 문서 유사도를 측정하는 문서 유사도 측정모듈(210); 및 상기 문서 유사도 측정모듈에 의한 각 문서에 대해서 유사도가 높은 순서대로 근접한 문서를 선택하여 그 문서에 대한 중첩 클러스터를 형성하는 클러스터 형성모듈(220);을 포함하는 것을 특징으로 하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템
4 4
제 1 항에 있어서, 상기 클러스터 순위 산출부(300)는, 상기 중첩 클러스터를 순위화하는 클러스터 모듈(310); 및 최대확률 추정을 이용하여 클러스터 기반 질의확률 언어모델을 추정하는 클러스터 검색모듈(320);을 포함하는 것을 특징으로 하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템
5 5
제 1 항에 있어서, 상기 웹 질의부(100)를 통해 상기 질의 확장부(400)에 의해 선택된 질의 확장 어휘에 대한 검색결과를 출력하는 출력부(600);를 더 포함하는 것을 특징으로 하는 중첩 클러스터를 이용한 피드백 문서의 재샘플링 시스템
6 6
재샘플링 방법에 있어서, (a) 제어부(700)가 웹 질의부(100)를 통해 질의에 대한 검색 어휘에 따라 언어 모델 기반으로 웹 문서를 검색하는 단계; (b) 상기 제어부가 상기 웹 질의부에 의해 검색된 문서집합에 대해서 중첩 클러스터부(200)를 통해 최근접 이웃 클러스터링을 하여 중첩 클러스터를 생성하는 단계; (c) 상기 제어부가 상기 중첩 클러스터부에 의해 생성된 중첩 클러스터들을 클러스터 순위 산출부(300)를 통해 중첩 클러스트들의 순위를 클러스터기반 언어모델(수학식6)에 의해 산출하고 클러스터 기반 질의확률 언어모델을 추정하는 단계; (수학식 6) (여기서, qi는 i번째 질의 어휘, m은 질의Q의 어휘 개수이고, Clu는 클러스터) (d) 상기 제어부가 상기 클러스터 순위 산출부에 의해 최상위로 순위화된 클러스터를 질의 확장부(400)를 통해 최상위로 순위화된 클러스터에 속하는 각 문서에 대해 초기 질의에 따른 검색 어휘의 확률P(Q|D)과 적합성 피드백 문서집합의 각 문서에서의 단어확률 P(w|D)를 곱한 것을 피드백 문서들 전체에 대해서 누적된 값이 가장 높은 것을 질의 확장 어휘로 선택하는 단계; 및 (e) 상기 제어부가 상기 질의 확장부에 의해 선택된 질의 확장 어휘를 피드백 처리부(500)를 통해 상기 웹 질의부로 피드백 입력하여 웹 문서를 검색하도록 하는 단계; 를 포함하는 것을 특징으로 하는 재샘플링 방법
7 7
제 6 항에 있어서, 상기 제 (e) 단계 이후, (f) 상기 제어부가 상기 제 (e) 단계의 질의 확장 어휘에 대한 검색 결과를 출력하는 단계; (g) 상기 제어부가 상기 웹 질의부의 입력수단을 통해 재검색 명령신호의 수신여부를 판단하는 단계; 및 (h) 상기 제 (g) 단계의 판단결과, 상기 제어부가 재검색 명령신호를 수신한 경우, 상기 피드백 처리부(500)로 제어신호를 보내어 상기 질의 확장부에 의해 선택된 질의 확장 어휘를 상기 웹 질의부(100)로 피드백 입력하고, 그 절차를 상기 제 (a) 단계로 이행하는 단계; 를 더 포함하는 것을 특징으로 하는 재샘플링 방법
8 8
제 6 항에 있어서, 상기 제 (a) 단계는, (a-1) 상기 제어부(700)가 문서검색 모듈(110)을 통해 문서를 검색하고 언어모델로부터 질의를 생성 또는 샘플링할 확률에 의해서 순위화하는 단계; 및 (a-2) 상기 제어부가 질의 확률 검색모듈(120)을 통해 최대확률 추정을 이용하여 문서 언어모델을 추정하는 단계;를 포함하는 것을 특징으로 하는 재샘플링 방법
9 9
제 6 항에 있어서, 상기 제 (b) 단계는, (b-1) 상기 제어부(700)가 문서 유사도 측정모듈(210)을 통해 검색된 문서집합들 사이의 유사도 계산을 위해 문서의 각 어휘를 TF-IDF가중치로 계산한 후, 코사인 계수(cosine coefficient)를 이용하여 문서 유사도를 측정하는 단계; 및 (b-1) 상기 제어부가 클러스터 형성모듈(220)을 통해 각 문서에 대해서 유사도가 높은 순서대로 근접한 문서를 선택하여 그 문서에 대한 중첩 클러스터를 생성하는 단계;를 포함하는 것을 특징으로 하는 재샘플링 방법
10 10
제 6 항에 있어서, 상기 제 (c) 단계는, (c-1) 상기 제어부(700)가 클러스터 모듈(310)을 통해 중첩 클러스터의 멤버로 속한 모든 문서를 연결하는 단계; (c-2) 상기 제어부가 상기 클러스터 모듈(310)을 통해 클러스터의 순위를 산출하는 단계; 및 (c-3) 상기 제어부가 클러스터 검색 모듈(320)을 통해 최대확률 추정을 이용하여 클러스터 기반 질의확률 언어모델을 추정하는 단계;를 포함하는 것을 특징으로 하는 재샘플링 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육과학기술부 한국산업기술재단 전북대학교 산학협력단 전라북도 IT 융합산업을 위한 주문형 인력양성 사업 시소러스와 어휘관계를 이용한 질의응답검색시스템