맞춤기술찾기

이전대상기술

신뢰도를 향상시킨 문서 구조 기반 군집 장치 및 방법

  • 기술번호 : KST2014011472
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 문서가 초점을 맞춘 관점별로 문서들을 문서의 구조를 기반으로 분류하여 군집하며, 군집 결과에 포함될 수 있는 오류들을 사용자들의 피드백을 이용하여 수정하는 문서 구조 기반 군집 장치 및 방법이 개시된다. 본 발명은, 입력받은 문서들을 주제별로 분류하며, 분류한 문서들의 키워드를 추출하고, 추출한 키워드의 중요도를 계산하며, 추출한 키워드 및 계산한 중요도를 이용하여 문서 군집을 실행하고, 문서 군집의 결과를 협력적 군집을 이용하여 보완하는 문서군집부; 및 문서 군집의 대상이 되는 문서 정보들을 입력받으며, 문서 군집의 결과를 출력하고, 출력한 문서 군집 결과의 오류 정보들을 입력받는 입출력부; 를 포함한다. 본 발명에 따르면, 사용자가 최소한의 시간 또는 노력만으로 다양한 관점에 근거하여 관심 있는 주제를 다룬 문서를 객관적이고 종합적으로 인식할 수 있으며, 사용자의 피드백에 의한 군집 결과의 연속적인 오류 수정을 이용하여 신뢰도를 향상시킬 수 있는 효과가 있다. 문서 군집, 사용자 피드백, 문서 구조, 키워드 추출, 중요도 계산
Int. CL G06F 17/21 (2006.01)
CPC G06F 17/30705(2013.01) G06F 17/30705(2013.01) G06F 17/30705(2013.01) G06F 17/30705(2013.01)
출원번호/일자 1020070082309 (2007.08.16)
출원인 한국과학기술원
등록번호/일자 10-0896702-0000 (2009.04.30)
공개번호/일자 10-2009-0017830 (2009.02.19) 문서열기
공고번호/일자 (20090514) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2007.08.16)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 송준화 대한민국 대전 유성구
2 박순일 대한민국 대전 유성구
3 강승우 대한민국 대전 유성구
4 정상영 대한민국 대전 유성구
5 최성원 미국 대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이은철 대한민국 서울특별시 송파구 법원로**길 **, A동 *층 ***호 (문정동, H비지니스파크)(*T국제특허법률사무소)
2 유완식 대한민국 서울특별시 강남구 테헤란로 ***, **층 *T 국제특허법률사무소 (역삼동, 여삼빌딩)(*T국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2007.08.16 수리 (Accepted) 1-1-2007-0591673-46
2 의견제출통지서
Notification of reason for refusal
2008.09.30 발송처리완료 (Completion of Transmission) 9-5-2008-0505308-38
3 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2008.11.26 수리 (Accepted) 1-1-2008-0816526-44
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2008.12.19 수리 (Accepted) 1-1-2008-0874489-91
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2008.12.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2008-0874487-00
6 등록결정서
Decision to grant
2009.04.29 발송처리완료 (Completion of Transmission) 9-5-2009-0181425-06
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.02.01 수리 (Accepted) 4-1-2013-5019983-17
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157993-01
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157968-69
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5158129-58
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
신뢰도를 향상시킨 문서 구조 기반 군집 장치에 있어서, 입력받은 문서들을 주제별로 분류하며, 분류한 문서들의 핵심 내용을 반영한 키워드를 추출하고, 추출한 키워드의 중요도를 계산하며, 추출한 키워드 및 계산한 중요도를 이용하여 문서 군집을 실행하고, 문서 군집의 결과를 협력적 군집을 이용하여 보완하는 문서군집부(100); 및 문서 군집의 대상이 되는 문서 정보들을 입력받으며, 문서 군집의 결과를 출력하고, 출력한 문서 군집 결과의 오류 정보들을 입력받는 입출력부(200); 를 포함하되, 상기 문서군집부(100)는, 입력받은 문서들을 주제별로 분류하며, 분류된 문서들로부터 키워드를 추출하는 키워드 추출수단(110); 추출된 키워드의 중요도를 문서의 본문 내용을 기반으로 계산하는 중요도 계산수단(120); 추출된 키워드 및 계산된 중요도를 이용하여, 문서들 사이의 유사도를 계산하는 유사도 계산수단(130); 상기 유사도 계산 결과를 이용하여 적합한 문서 군집의 개수를 결정하며, 결정된 군집 개수에 따라 문서 군집 결과를 생성하는 군집개수 결정수단(140); 및 상기 군집개수 설정수단(140)에 의한 군집 결과의 오류들을 협력적 군집에 의하여 수정하는 후처리수단(150); 을 포함하는 것을 특징으로 하며, 상기 키워드의 중요도는, 키워드가 포함된 단락의 위치, 키워드의 출현 횟수, 키워드가 포함된 단락의 길이 및 키워드가 포함된 문장의 길이 중에서 어느 하나 이상의 변수를 이용하여 계산되는 것을 특징으로 하고, 상기 입출력부(200)는 태깅(Tagging) 인터페이스 및 드래그(Drag) 앤드(and) 드랍(Drop) 인터페이스 중에서 어느 하나 이상을 구비하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
2 2
삭제
3 3
제 1 항에 있어서, 상기 유사도의 계산은 코사인(cosine) 측정(measure)에 의해 수행되는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
4 4
제 1 항에 있어서, 상기 입력받은 문서들은 뉴스 기사 또는 신문 기사인 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
5 5
제 4 항에 있어서, 상기 문서군집부(100)는 뉴스 기사 또는 신문 기사의 제목, 부제 및 리드(Lede)로부터 키워드를 추출하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
6 6
삭제
7 7
제 1 항에 있어서, 상기 키워드의 중요도는 다음의 수학식에 의해 계산되는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
8 8
제 1 항에 있어서, 상기 문서 군집은 Hierarchical Agglomerative Clustering 방법을 이용하여 실행되는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
9 9
제 8 항에 있어서, Elbow Criterion을 이용하여 적합한 문서 군집의 개수를 자동으로 결정하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 장치
10 10
삭제
11 11
신뢰도를 향상시킨 문서 구조 기반 군집 방법에 있어서, (a) 문서 군집의 대상이 되는 문서 정보들을 입력받는 단계; (b) 입력받은 문서들로부터 키워드를 추출하는 단계; (c) 추출된 키워드의 중요도를 계산하는 단계; (d) 추출된 키워드 및 계산된 중요도를 이용하여 문서들 사이의 유사도를 계산하는 단계; (e) 유사도 계산 결과를 이용하여 문서 군집 결과를 생성하는 단계; (f) 생성한 문서 군집 결과를 출력하는 단계; 및 (g) 출력한 문서 군집 결과를 협력적 군집에 의하여 보완하는 단계; 를 포함하되, 상기 (b) 단계는, (b-1) 입력받은 문서들을 주제별로 분류하는 단계; 를 포함하는 것을 특징으로 하며, 상기 (c) 단계는, (c-1) 키워드가 포함된 단락 또는 문장의 문서 내에서의 위치를 고려하기 위해 디미니싱 팩터(Diminishing Factor)를 계산하는 단계; (c-2) 전체 문서 길이에 대한 키워드가 포함된 단락 또는 문장의 길이의 비율을 계산하는 단계; 및 (c-3) 문서 내에서 각 키워드의 출현시마다 중요도의 합을 계산하는 단계; 를 포함하는 것을 특징으로 하고, 상기 (g) 단계는, (g-1) 태깅(Tagging) 인터페이스를 통해 사용자로부터 문서의 키워드를 입력받는 단계; 및 (g-2) 드래그(Drag) 앤드(and) 드랍(Drop) 인터페이스를 통해 사용자에 의해 잘못 군집된 문서라고 판단된 문서의 이동 신호를 수신하는 단계; 를 포함하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 방법
12 12
삭제
13 13
제 11 항에 있어서, 상기 (b) 단계는, (b-2) 입력받은 문서들로부터 불용어를 제거하는 단계; 및 (b-3) 불용어가 제거된 문서들로부터 어근을 추출하는 단계; 를 포함하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 방법
14 14
삭제
15 15
삭제
16 16
제 11 항에 있어서, 상기 (g-1) 단계는, (g-1-1) 상기 태깅 인터페이스를 통해 입력된 키워드를 포함하지 않는 단어 집합을 가진 문서들을 검색하는 단계; (g-1-2) 검색한 단어 집합에 상기 태깅 인터페이스를 통해 입력된 키워드를 추가하는 단계; 및 (g-1-3) 추가한 키워드의 중요도를 계산하는 단계; 를 포함하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 방법
17 17
삭제
18 18
제 11 항에 있어서, 상기 (g-2) 단계는, (g-2-1) 이동되는 문서에 포함된 단어들을 이동 후의 군집이 가지는 단어 집합과 중복되는 단어들 및 이동 전의 군집이 가지는 단어 집합과 중복되는 단어들로 분류하는 단계; 및 (g-2-2) 이동 후의 군집이 가지는 단어 집합과 중복되는 단어들 및 이동 전의 군집이 가지는 단어 집합과 중복되는 단어들에 대하여 서로 다른 가중치를 부여하는 단계; 를 포함하는 것을 특징으로 하는 신뢰도를 향상시킨 문서 구조 기반 군집 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.