맞춤기술찾기

이전대상기술

단어연관그래프를 이용한 단어 의미의 자동 군집 기법

  • 기술번호 : KST2014011327
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 단어연관그래프를 이용하여 자동으로 단어의 의미 그룹을 찾아내는 기법에 관한 것으로, 단어의 의미 그룹은 중의성을 가진 단어의 의미를 설명하는 연관단어들의 군집으로 정보 검색이나 자연어처리 분야 등에서 중요한 이슈이다. 본 발명에서는 크게 대단위 말뭉치로부터 얻어낸 동시출현정보를 이용해 단어 클러스터링을 수행하는 1단계; 자동으로 의미별 연관단어 군집을 추출하는 2단계; 임계값 이상의 상호정보량을 만족하는 연관단어와 연결정보를 이용하여 단어연관그래프를 생성하는 3단계; 작고 많은 수의 하부 군집으로 분할하는 4단계; 하부 군집들에 대한 재군집화를 수행하는 5단계; 상호정보량 임계치에 대해 최적의 군집결과를 선정하는 6단계; 군집내 연관단어들 중 군집의 의미를 가장 강하게 나타내는 대표단어 선정과정 7단계를 포함한다. 보다 자세하게는 상기과정에서 상호정보량으로 단어간의 연관성을 정량화하여 단어연관그래프를 생성시키고, 본 발명에서 제시한 단어의 중복을 허용하는 그래프 분할 알고리즘 HEMWRG을 사용하여 단어연관그래프의 초기 군집을 생성한다. 생성된 초기 군집은 그래프 기반의 클러스터링 기법을 통하여 연관단어들의 의미 그룹으로 생성된다. 또한 상대적 군집평가인덱스를 정의하고, 이를 적용하여 생성된 군집의 적합도를 평가한다. 본 발명에 따르면 실제 웹문서에서 추출한 단어 동시출현정보에 적용하여 의미적으로 유사한 연관단어의 군집을 생성할 수 있는 효과가 있다. 단어 연관 그래프, 연관 단어, 의미 단위 그룹
Int. CL G06F 17/26 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/30713(2013.01) G06F 17/30713(2013.01)
출원번호/일자 1020080092530 (2008.09.22)
출원인 숭실대학교산학협력단
등록번호/일자
공개번호/일자 10-2010-0033585 (2010.03.31) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2010.03.30)
심사청구항수 3

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수원 대한민국 서울특별시 서초구
2 민병국 대한민국 서울특별시 영등포구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 최관락 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)
2 송인호 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)
3 민영준 대한민국 서울특별시 강남구 남부순환로 ****, *층(도곡동, 차우빌딩)(맥스국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.09.22 수리 (Accepted) 1-1-2008-0662686-17
2 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2009.01.12 수리 (Accepted) 1-1-2009-0018572-73
3 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2010.03.30 수리 (Accepted) 1-1-2010-0203193-81
4 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2010.12.14 불수리 (Non-acceptance) 1-1-2010-0821447-12
5 서류반려이유통지서
Notice of Reason for Return of Document
2010.12.16 발송처리완료 (Completion of Transmission) 1-5-2010-0112102-28
6 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2010.12.17 수리 (Accepted) 1-1-2010-0832476-83
7 서류반려통지서
Notice for Return of Document
2010.12.21 발송처리완료 (Completion of Transmission) 1-5-2010-0113528-32
8 선행기술조사의뢰서
Request for Prior Art Search
2011.03.11 수리 (Accepted) 9-1-9999-9999999-89
9 선행기술조사보고서
Report of Prior Art Search
2011.04.12 수리 (Accepted) 9-1-2011-0029953-24
10 의견제출통지서
Notification of reason for refusal
2011.05.12 발송처리완료 (Completion of Transmission) 9-5-2011-0256843-62
11 거절결정서
Decision to Refuse a Patent
2011.08.04 발송처리완료 (Completion of Transmission) 9-5-2011-0439537-98
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
HEM 알고리즘을 기본으로 단어의 중의적 특징을 반영할 수 있도록 수정한 HEMWRG 알고리즘을 청구한다 HEMWRG 알고리즘은 첫 번째 과정으로 단일 정점으로 이루어진 초기 그래프를 무게를 가진 다중정점들로 이루어진 그래프로 변환하고, 초기 그래프의 각 정점으로부터 깊이가 1인 너비우선탐색으로 간선들을 탐색하여 연결된 정점을 찾고 탐색된 정점들과 간선들을 접어 하나의 다중정점으로 만드는 모듈; 다중정점의 무게는 포함된 간선들의 무게의 합이 된다
2 2
제 1항에 있어서, 그래프의 밀도는 일반적으로 그래프의 정점간에 존재하는 간선수의 완전연결의 간선수에 대한 비율로 계산되는 모듈; 무게를 가진 간선인 경우에는 완전연결의 간선수에 대한 간선들의 무게의 합으로 계산하는 모듈; 것을 특징으로 하는 단어연관그래프를 이용하여 자동으로 단어의 의미 그룹을 찾아내는 기법
3 3
제 2항에 있어서, 연관단어 클러스터링에 의해 생성된 군집은 여러 단어들을 포함하게 된다
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.