기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

리치니스를 이용한 문서 집합의 토픽 단어 추출 방법

기술번호 : KST2014053736
담당센터 : 경기기술혁신센터
전화번호 : 031-8006-1570

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법에 관한 것으로 보다 상세하게는, 문서의 집합(예컨대 블로그 포스트의 집합) 상에서 후보 토픽 워드에 대한 커버리지 비교를 통해 토픽들 중 상대적으로 중요하고 비중있게 언급된 것을 찾아 가중치 및 랭킹을 부여하기 위한 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법에 관한 것이다. 본 발명은, 온라인 또는 사용자단말에 저장된 문서 집합에서 후보 토픽 단어(Topic Word)들을 추출하는 제 1 단계; 상기 추출된 각 토픽 단어(Topic Word)들에 대응되는 문서들에 대한 그룹핑(Grouping)을 통해 문서들의 그룹을 적어도 하나 이상 생성하는 제 2 단계; 상기 각 토픽 단어(Topic Word)들을 쿼리(Query)로 미리 설정된 온라인 검색 집합 대상에서 연관 문서를 서치하여 서치 결과를 얻은 뒤 클러스터링(Clustering)을 수행하는 제 3 단계; 상기 각 토픽 단어(Topic Word)에 따라 생성된 클러스터들은 각각 해당 토픽에 대한 서브토픽으로 가정 한 뒤, 상기 각 토픽 단어(Topic Word)를 기초로 상기 그룹핑된 문서를 구성하는 각 문서, 그리고 상기 각 토픽 단어(Topic Word)의 서브 토픽에 해당하는 클러스터들을 구성하는 각 클러스터 간의 유사도를 연산하는 제 4 단계; 상기 각 토픽 단어에 대해 상기 연산된 상기 문서 집합에 속하는 각 문서와 클러스터 간의 유사도를 이용해 상기 문서 집합에 포함된 각 문서와 가장 유사한 클러스터를 매칭하는 제 5 단계; 상기 매칭된 클러스터 수, 그리고 상기 토픽 단어에 대해 상기 문서 집합에 속하는 각 문서와 클러스터와의 유사도의 정량적 수치를 이용해 리치니스(Richness) 점수를 산출하는 제 6 단계; 및 상기 각 토픽 단어의 리치니스(Richness) 점수를 산출하여 리치니스 점수가 높은 순으로 정렬하여 제공한 뒤, 상위로부터 미리 설정된 개수(NO)를 선택하여 최종 토픽 단어로 추출하는 제 7 단계를 포함하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법을 제공함으로써, 문서의 집합(예컨대 블로그 포스트의 집합) 상에서 후보 토픽 워드에 대한 커버리지 비교를 통해 토픽들 중 상대적으로 중요하고 비중있게 언급된 것을 찾아 가중치 및 랭킹을 부여할 수 있는 효과를 제공한다.
Int. CL	G06F 17/27 (2006.01) G06F 17/21 (2006.01)
CPC	G06F 17/30705(2013.01) G06F 17/30705(2013.01) G06F 17/30705(2013.01)
출원번호/일자	1020120006633 (2012.01.20)
출원인	성균관대학교산학협력단
등록번호/일자	10-1266504-0000 (2013.05.15)
공개번호/일자
공고번호/일자	(20130524) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	소멸
심사진행상태	수리
심판사항
구분	신규
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2012.01.20)
심사청구항수	12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	성균관대학교산학협력단	대한민국	경기도 수원시 장안구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	박진희	대한민국	경기 수원시 장안구
2	정혜욱	대한민국	서울 동작구
3	이지형	대한민국	서울 용산구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	남정길	대한민국	서울특별시 강남구 테헤란로길 , 인화빌딩 *층 (삼성동)(특허법인(유한)아이시스)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	성균관대학교산학협력단		경기도 수원시 장안구

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2012.01.20	수리 (Accepted)	1-1-2012-0055234-51
2	출원인정보변경(경정)신고서 Notification of change of applicant's information	2012.04.26	수리 (Accepted)	4-1-2012-5090770-53
3	출원인정보변경(경정)신고서 Notification of change of applicant's information	2012.06.20	수리 (Accepted)	4-1-2012-5131828-19
4	출원인정보변경(경정)신고서 Notification of change of applicant's information	2012.06.27	수리 (Accepted)	4-1-2012-5137236-29
5	등록결정서 Decision to grant	2013.05.07	발송처리완료 (Completion of Transmission)	9-5-2013-0315377-84
6	출원인정보변경(경정)신고서 Notification of change of applicant's information	2017.02.23	수리 (Accepted)	4-1-2017-5028829-43

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 온라인 또는 사용자단말에 저장된 문서 집합에서 후보 토픽 단어(Topic Word)들을 추출하는 제 1 단계;상기 추출된 각 토픽 단어(Topic Word)들에 대응되는 문서들에 대한 그룹핑(Grouping)을 통해 문서들의 그룹을 적어도 하나 이상 생성하는 제 2 단계;상기 각 토픽 단어(Topic Word)들을 쿼리(Query)로 미리 설정된 온라인 검색 집합 대상에서 연관 문서를 서치하여 서치 결과를 얻은 뒤 클러스터링(Clustering)을 수행하는 제 3 단계;상기 각 토픽 단어(Topic Word)에 따라 생성된 클러스터들은 각각 해당 토픽에 대한 서브토픽으로 가정 한 뒤, 상기 각 토픽 단어(Topic Word)를 기초로 상기 그룹핑된 문서를 구성하는 각 문서, 그리고 상기 각 토픽 단어(Topic Word)의 서브 토픽에 해당하는 클러스터들을 구성하는 각 클러스터 간의 유사도를 연산하는 제 4 단계;상기 각 토픽 단어에 대해 상기 연산된 상기 문서 집합에 속하는 각 문서와 클러스터 간의 유사도를 이용해 상기 문서 집합에 포함된 각 문서와 가장 유사한 클러스터를 매칭하는 제 5 단계; 및상기 매칭된 클러스터 수, 그리고 상기 토픽 단어에 대해 상기 문서 집합에 속하는 각 문서와 클러스터와의 유사도의 정량적 수치를 이용해 리치니스(Richness) 점수를 산출하는 제 6 단계; 및상기 각 토픽 단어의 리치니스(Richness) 점수를 산출하여 리치니스 점수를 정렬하여 제공한 뒤, 상위로부터 미리 설정된 개수(NO)를 선택하여 최종 토픽 단어로 추출하는 제 7 단계; 를 포함하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
2	2 제 1항에 있어서, 상기 제 1 단계는,상기 문서별 용어 추출(Term Extraction) 알고리즘을 적용하여 상기 문서 집합에서 상기 후보 토픽 단어들을 추출하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
3	3 제 1항에 있어서, 상기 제 3 단계의 상기 미리 설정된 온라인 검색 집합 대상은,웹(Web) 및 뉴스(News), 블로고스피어(Blogosphere) 중 적어도 하나 이상 포함하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
4	4 제 1항에 있어서, 상기 제 3 단계는,상기 서치 결과를 얻은 뒤, 클러스터링 알고리즘(Clustering Algorithm)을 적용하여 클러스터링(Clustering)을 수행하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
5	5 제 1항에 있어서, 상기 제 3 단계의 상기 클러스터링은, 같은 속성을 갖는 연관 문서들을 여러 개 모아서 하나의 대상으로 한 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
6	6 제 1항에 있어서, 상기 제 4 단계는,상기 유사도인 (Rel(d, Ci))을 에 의해 연산하며, 상기 d는 하나의 토픽 단어(Topic Word)들에 대응되는 문서들에 대한 그룹핑(Grouping)을 통해 생성된 문서들의 그룹인 C 상에서 하나의 문서를 나타내며, 상기 Ci는 해당 하나의 토픽 단어를 기초로 서칭 및 클러스터링 되어 생성된 i(i는 1 이상의 자연수)번째 클러스터를 의미하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
7	7 제 6항에 있어서, 상기 제 5 단계는,상기 서브토픽에 대한 커버리지(Coverage)를 알아보기 위해 상기 제 4 단계에서 연산된 각 문서와 클러스터 간의 유사도를 이용해 가장 유사한 클러스터에 각 토픽 단어로 설정된 각 문서를 매칭시키는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
8	8 제 7에 있어서, 상기 제 5 단계는,클러스터 Ci에 대해 그룹핑된 문서들 중 최종적으로 문서 d는 에 의해 매칭되며, 그룹 C에서 문서에 매칭된 클러스터를 의미하는 C(d)는 상기 에 의해 연산된 클러스터 중 유사도가 최대값을 갖는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
9	9 제 8항에 있어서, 상기 제 6 단계는, 그룹 C에서 문서에 매칭된 클러스터를 나타내는 "C(d)"에 대한 매칭된 문서 d와의 유사도를 나타내는 Rel(d, C(d))의 합을 나타내는 유사도 점수(Scorerel(w))를 에 의해 연산하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
10	10 제 9항에 있어서, 상기 제 6 단계는, 상기 매칭된 클러스터 수를 의미하는 Scorecluster(w)는 에 의해 연산하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
11	11 제 10항에 있어서, 상기 제 6 단계는,상기 리치니스(Richness) 점수를 나타내는 Scorerich(W)는에 의해 상기 유사도 점수(Scorerel(w))와 상기 매칭된 클러스터 수(Scorecluster(w))의 멀티플라이에 의해 연산되는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
12	12 제 10항에 있어서, 상기 제 6 단계는,상기 리치니스(Richness) 점수를 나타내는 Scorerich(W)는상기 유사도 점수(Scorerel(w))와 상기 매칭된 클러스터 수(Scorecluster(w))의 합에 의해 연산되는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	정부)교과부	성균관대학교	2010일반기초연구지원사업(공동)	글쓰기 능력 향상을 위한 웹기반의 지능형 동료평가시스템

본 등록정보는 참고용으로 법적증빙자료로 사용할 수 없습니다.
데이터 이관에 따른 소요기간(1일)으로 인하여 등록원부와 일부 차이가 발생할 수 있으며, 일부 정보(부기, 상세 주소 등)를 제공하지 않고 있습니다.
법적증빙자료로 활용하시거나 더 자세한 정보를 보시려면 등록원부를 발급받아 사용하시기 바랍니다.

이전대상기술 뷰 페이지 등록사항 > 특허 등록번호 표입니다.
특허 등록번호	10-1266504-0000

권리란

표시번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 권리란 표입니다.
표시번호	사항
1	출원 연월일 : 20120120 출원 번호 : 1020120006633 공고 연월일 : 20130524 공고 번호 : 특허결정(심결)연월일 : 20130507 청구범위의 항수 : 12 유별 : G06F 17/27 발명의 명칭 : 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법 존속기간(예정)만료일 : 20180516

특허권자란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 특허권자란 표입니다.
순위번호	사항
1	(권리자) 성균관대학교산학협력단 경기도 수원시 장안구...

등록료란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 등록료란 표입니다.
제 1 - 3 년분	금 액	256,500 원	2013년 05월 15일	납입
제 4 년분	금 액	212,800 원	2016년 03월 28일	납입
제 5 년분	금 액	212,800 원	2017년 03월 29일	납입

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2012.01.20	수리 (Accepted)	1-1-2012-0055234-51
2	출원인정보변경(경정)신고서	2012.04.26	수리 (Accepted)	4-1-2012-5090770-53
3	출원인정보변경(경정)신고서	2012.06.20	수리 (Accepted)	4-1-2012-5131828-19
4	출원인정보변경(경정)신고서	2012.06.27	수리 (Accepted)	4-1-2012-5137236-29
5	등록결정서	2013.05.07	발송처리완료 (Completion of Transmission)	9-5-2013-0315377-84
6	출원인정보변경(경정)신고서	2017.02.23	수리 (Accepted)	4-1-2017-5028829-43


기술번호	KST2014053736
자료제공기관	NTB
기술공급기관	성균관대학교
기술명	리치니스를 이용한 문서 집합의 토픽 단어 추출 방법
기술개요	본 발명은 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법에 관한 것으로 보다 상세하게는, 문서의 집합(예컨대 블로그 포스트의 집합) 상에서 후보 토픽 워드에 대한 커버리지 비교를 통해 토픽들 중 상대적으로 중요하고 비중있게 언급된 것을 찾아 가중치 및 랭킹을 부여하기 위한 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법에 관한 것이다. 본 발명은, 온라인 또는 사용자단말에 저장된 문서 집합에서 후보 토픽 단어(Topic Word)들을 추출하는 제 1 단계; 상기 추출된 각 토픽 단어(Topic Word)들에 대응되는 문서들에 대한 그룹핑(Grouping)을 통해 문서들의 그룹을 적어도 하나 이상 생성하는 제 2 단계; 상기 각 토픽 단어(Topic Word)들을 쿼리(Query)로 미리 설정된 온라인 검색 집합 대상에서 연관 문서를 서치하여 서치 결과를 얻은 뒤 클러스터링(Clustering)을 수행하는 제 3 단계; 상기 각 토픽 단어(Topic Word)에 따라 생성된 클러스터들은 각각 해당 토픽에 대한 서브토픽으로 가정 한 뒤, 상기 각 토픽 단어(Topic Word)를 기초로 상기 그룹핑된 문서를 구성하는 각 문서, 그리고 상기 각 토픽 단어(Topic Word)의 서브 토픽에 해당하는 클러스터들을 구성하는 각 클러스터 간의 유사도를 연산하는 제 4 단계; 상기 각 토픽 단어에 대해 상기 연산된 상기 문서 집합에 속하는 각 문서와 클러스터 간의 유사도를 이용해 상기 문서 집합에 포함된 각 문서와 가장 유사한 클러스터를 매칭하는 제 5 단계; 상기 매칭된 클러스터 수, 그리고 상기 토픽 단어에 대해 상기 문서 집합에 속하는 각 문서와 클러스터와의 유사도의 정량적 수치를 이용해 리치니스(Richness) 점수를 산출하는 제 6 단계; 및 상기 각 토픽 단어의 리치니스(Richness) 점수를 산출하여 리치니스 점수가 높은 순으로 정렬하여 제공한 뒤, 상위로부터 미리 설정된 개수(NO)를 선택하여 최종 토픽 단어로 추출하는 제 7 단계를 포함하는 것을 특징으로 하는 리치니스를 이용한 문서 집합의 토픽 단어 추출 방법을 제공함으로써, 문서의 집합(예컨대 블로그 포스트의 집합) 상에서 후보 토픽 워드에 대한 커버리지 비교를 통해 토픽들 중 상대적으로 중요하고 비중있게 언급된 것을 찾아 가중치 및 랭킹을 부여할 수 있는 효과를 제공한다.
개발상태	기술개발진행중
기술의 우수성
응용분야	정보통신
시장규모 및 동향
희망거래유형	기술매매,라이센스,
사업화적용실적
도입시고려사항


과제고유번호	1345145815
세부과제번호	32A-2010-1-H00011
연구과제명	글쓰기 능력 향상을 위한 웹기반의 지능형 동료평가시스템
성과구분	출원
부처명	교육과학기술부
연구관리전문기관명	한국연구재단
연구주관기관명	성균관대학교
성과제출연도	2011
연구기간	201005~201304
기여율	1
연구개발단계명	기초연구
6T분류명

특허성과

[1020120006633]	리치니스를 이용한 문서 집합의 토픽 단어 추출 방법	새창보기
[1020110109943]	학습 성과 추론 방법 및 장치	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2015003569][성균관대학교]	TF Smoothing 기법과 LDA를 이용한 블로그 토픽 분석	새창보기
[KST2015144006][성균관대학교]	문서 특징을 반영하는 요약문 생성 장치 및 방법	새창보기
[KST2016017066][성균관대학교]	잠재 키워드 생성 방법 및 장치(LATENT KEYPARASE GENERATION METHOD AND APPARATUS)	새창보기
[KST2015142898][성균관대학교]	에이전트 기반 검색 서비스 제공 방법 및 그 시스템	새창보기
[KST2018011724][성균관대학교]	감정 수치화 및 이를 이용한 클라이맥스 예측 장치 및 방법	새창보기
[KST2018004559][성균관대학교]	다면지표를 활용한 기술평가장치, 시스템 및 이에 대한 평가 방법(APPARATUS, SYSTEM FOR EVALUATING A TECHNOLOGY USING MULTISOURCE INDEX AND METHOD THEREOF)	새창보기
[KST2018002813][성균관대학교]	리뷰 데이터의 감성을 분류하기 위한 방법 및 장치(AN APPARATUS FOR ANALYZING SENTIMENT OF REVIEW DATA AND METHOD THEREOF)	새창보기
[KST2019022899][성균관대학교]	문서의 상대적 특징을 반영한 문서 요약 방법 및 시스템	새창보기
[KST2014040041][성균관대학교]	동적 코드 분석 장치 및 방법	새창보기
[KST2019022898][성균관대학교]	재귀 오토인코더 기반 문장 벡터 모델링을 이용하는 문서 요약 방법 및 문서 요약 시스템	새창보기
[KST2018002812][성균관대학교]	인공 신경망 기반의 문단 생성 방법 및 장치(AN APPARATUS FOR GENERATING PARAGRAPH BASED ON ARTIFICIAL NEURAL NETWORK AND METHOD THEREOF)	새창보기
[KST2015144046][성균관대학교]	유전 알고리즘을 이용한 감정근거 추출 방법 및 장치, 및 상기 감정근거를 이용한 감성 분류 방법 및 장치	새창보기
[KST2014027851][성균관대학교]	스니펫 제공 장치 및 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택