맞춤기술찾기

이전대상기술

부분 워드넷을 결합한 온톨로지에 의한 문서 분류

  • 기술번호 : KST2014011761
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템 및 방법에 관한 것으로, IPTV 및 멀티미디어 데이터의 지능형 검색을 위해 시맨틱 웹 기반의 온톨로지를 사용하여 특정 서비스 영역에 사용되는 어휘를 의미적으로 계층화하여 반자동 모델링하고, 모델링된 온톨로지를 기반으로 데이터에 관련 있는 콘텐츠로 자동 분류하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템 및 방법에 관한 것이다. 온톨로지 모델링을 위해 입력되는 학습 VOD 시놉시스 데이터로부터 모델링할 콘텐츠의 키워드를 추출하고, 문서 분류를 위해 콘텐츠 기술을 정의하여 콘텐츠 온톨로지를 생성하는 콘텐츠 생성부와; 모든 도메인에 독립적으로 사용될 수 있는 핵심 온톨로지와 도메인에 종속적인 도메인 온톨로지를 모델링하는 반자동 온톨로지 모델링부와; 상기 학습 VOD 시놉시스 데이터를 기초로 모델링한 온톨로지를 기반으로 새로운 VOD 시놉시스 데이터가 입력되면 그 문서의 콘텐츠를 추론하여 분류하는 문서분류 시스템부와; 상기 콘텐츠 생성부와 반자동 온톨로지 모델링부 및 문서분류 시스템부에서 생성된 데이터가 저장되는 지식 베이스로 구성된다. 따라서, 본 발명은 워드넷에서 표현하지 못한 어휘의 의미적 관계 추론을 가능하고, 상기 워드넷에 없는 외래어와 한자어는 대체 어휘로 앵커링하여 한국인의 사고 체계에 맞고 서비스 도메인에 적합한 효과가 있다.
Int. CL G06F 17/21 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/3082(2013.01) G06F 17/3082(2013.01) G06F 17/3082(2013.01)
출원번호/일자 1020100017059 (2010.02.25)
출원인 숭실대학교산학협력단, 주식회사 케이티
등록번호/일자 10-1137153-0000 (2012.04.09)
공개번호/일자 10-2011-0097287 (2011.08.31) 문서열기
공고번호/일자 (20120419) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2010.02.25)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구
2 주식회사 케이티 대한민국 경기도 성남시 분당구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 박영택 대한민국 서울특별시 서초구
2 최정화 대한민국 경기도 남양주시
3 백규태 대한민국 서울특별시 용산구
4 김효민 대한민국 서울특별시 서초구
5 임우영 대한민국 경기도 성남시 분당구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 송경근 대한민국 서울특별시 서초구 서초대로**길 ** (방배동) 기산빌딩 *층(엠앤케이홀딩스주식회사)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 서울특별시 동작구
2 주식회사 케이티 경기도 성남시 분당구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2010.02.25 수리 (Accepted) 1-1-2010-0123699-16
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.04.19 수리 (Accepted) 4-1-2010-5068437-23
3 [대리인선임]대리인(대표자)에 관한 신고서
[Appointment of Agent] Report on Agent (Representative)
2011.01.04 수리 (Accepted) 1-1-2011-0004097-73
4 의견제출통지서
Notification of reason for refusal
2011.05.30 발송처리완료 (Completion of Transmission) 9-5-2011-0292537-39
5 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2011.07.27 수리 (Accepted) 1-1-2011-0581702-21
6 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2011.08.22 수리 (Accepted) 1-1-2011-0649271-16
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.09.29 수리 (Accepted) 1-1-2011-0762325-67
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.09.29 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2011-0762336-69
9 최후의견제출통지서
Notification of reason for final refusal
2011.11.18 발송처리완료 (Completion of Transmission) 9-5-2011-0674934-12
10 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.12.05 수리 (Accepted) 1-1-2011-0962906-19
11 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2011.12.05 보정승인 (Acceptance of amendment) 1-1-2011-0962915-20
12 등록결정서
Decision to grant
2012.01.09 발송처리완료 (Completion of Transmission) 9-5-2012-0013707-18
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.01.10 수리 (Accepted) 4-1-2012-5005621-98
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.03.21 수리 (Accepted) 4-1-2012-5058926-38
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.06.08 수리 (Accepted) 4-1-2012-5122434-12
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.07.31 수리 (Accepted) 4-1-2013-5106568-91
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018159-78
18 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템으로서,학습 VOD 시놉시스(S) 데이터에 포함된 단어를 이용하여 장르, 콘텐츠 유형 및 콘텐츠 키워드로 이루어진 콘텐츠 온톨로지를 생성하는 콘텐츠 생성부(100);상기 콘텐츠 온톨로지에 포함된 상기 콘텐츠 키워드를 워드넷의 부분 트리와 연결하여 모든 도메인에 독립적으로 사용될 수 있는 핵심 온톨로지를 모델링하고, 상기 핵심 온톨로지를 기반으로 온톨로지 함의(subsumption) 관계 추론을 적용하여 도메인에 종속적인 도메인 온톨로지를 모델링하는 반자동 온톨로지 모델링부(200); 및새로운 VOD 시놉시스(N) 데이터가 입력된 경우, 상기 도메인 온톨로지를 기반으로 상기 새로운 VOD 시놉시스(N) 데이터에 대응되는 장르 및 콘텐츠 유형을 분류하는 문서분류 시스템부(300);를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템
2 2
제 1항에 있어서, 상기 콘텐츠 생성부(100)는,텍스트 마이닝 기법을 이용하여, 상기 학습 VOD 시놉시스(S) 데이터로부터 단어를 추출하고, 상기 추출된 단어를 군집화한 후 각 군집의 중심 벡터에서 가장 높은 값을 가지는 소정 개수의 상기 콘텐츠 키워드를 추출하며, 상기 추출된 콘텐츠 키워드의 특징을 대표하는 단어인 상기 콘텐츠 유형을 추출하는 콘텐츠 키워드 추출부(110); 및상기 콘텐츠 키워드 추출부(110)에서 추출된 상기 콘텐츠 유형 및 상기 콘텐츠 키워드를 장르별로 상기 콘텐츠 온톨로지에 정의하는 콘텐츠 정의부(120);를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템
3 3
제 1항에 있어서,상기 반자동 온톨로지 모델링부(200)는,상기 콘텐츠 온톨로지에 포함된 상기 콘텐츠 키워드가 상기 워드넷에 정의되어 있는 경우, 상기 콘텐츠 키워드, 상기 콘텐츠 키워드의 상위어, 상기 콘텐츠 키워드의 하위어 및 상기 콘텐츠 키워드의 동의어 중 적어도 하나와 대응되는 상기 워드넷의 부분 트리를 상기 콘텐츠 키워드와 연결하고, 상기 콘텐츠 키워드가 상기 워드넷에 정의되어 있지 않은 경우, 국어 사전에서 추출된 상기 콘텐츠 키워드의 동의어 또는 영어 사전에서 추출된 상기 콘텐츠 키워드의 영어 단어와 대응되는 상기 워드넷의 부분 트리를 상기 콘텐츠 키워드와 연결하여 상기 핵심 온톨로지를 모델링하는핵심 온톨로지 모델링부(210); 및온톨로지 함의(subsumption) 관계 추론을 통해 상기 핵심 온톨로지 모델링부(210)에서 모델링된 서로 다른 상기 핵심 온톨로지를 결합하여 상기 도메인 온톨로지를 모델링하는 도메인 온톨로지 모델링부(220);를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템
4 4
제 1항에 있어서,상기 문서분류 시스템부(300)는,상기 새로운 VOD 시놉시스(N) 데이터로부터 상기 도메인 온톨로지에 정의된 단어 집합을 추출하고, 상기 추출된 단어 집합을 기술(description)로 가지는 임시 클래스를 상기 도메인 온톨로지에 생성하는 키워드 추출기(310); 및온톨로지 함의(subsumption) 관계 추론을 이용하여 상기 키워드 추출기(310)에 의해 생성된 상기 임시 클래스를 기초로 상기 새로운 VOD 시놉시스(N) 데이터의 콘텐츠 유형 및 장르를 추론하는 콘텐츠 추론기(320);를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템
5 5
제 1항에 있어서,상기 콘텐츠 생성부(100)에 의해 생성된 상기 콘텐츠 온톨로지, 상기 반자동 온톨로지 모델링부(200)에 의해 모델링된 상기 핵심 온톨로지 및 상기 도메인 온톨로지, 및 상기 문서분류 시스템부(300)에 의해 분류된 상기 새로운 VOD 시놉시스(N) 데이터의 장르 및 콘텐츠 유형을 저장하는 지식 베이스(400)를 더 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 시스템
6 6
부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법으로서,학습 VOD 시놉시스(S) 데이터에 포함된 단어를 이용하여 장르, 콘텐츠 유형 및 콘텐츠 키워드로 이루어진 콘텐츠 온톨로지를 생성하는 단계;상기 콘텐츠 온톨로지에 포함된 상기 콘텐츠 키워드를 워드넷의 부분 트리와 연결하여 모든 도메인에 독립적으로 사용될 수 있는 핵심 온톨로지를 모델링하는 단계;상기 핵심 온톨로지를 기반으로 온톨로지 함의(subsumption) 관계 추론을 적용하여 도메인에 종속적인 도메인 온톨로지를 모델링하는 단계; 및새로운 VOD 시놉시스(N) 데이터가 입력된 경우, 상기 도메인 온톨로지를 기반으로 상기 새로운 VOD 시놉시스(N) 데이터에 대응되는 장르 및 콘텐츠 유형을 분류하는 단계;를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
7 7
제 6항에 있어서,상기 콘텐츠 온톨로지 생성 단계는,상기 학습 VOD 시놉시스(S) 데이터로부터 단어를 추출하는 단계;상기 추출된 단어를 군집화하고 각 군집에서 중심 벡터를 선정하는 단계;특징 벡터 생성시 변별력 있는 단어를 추출하기 위해 상기 추출된 단어를 필터링하는 단계;하나의 노드에 의해 콘텐츠 유형이 변경되지 않도록 노드를 평준화하는 단계;상기 각 군집의 중심 벡터에서 가장 높은 값을 가지는 소정 개수의 상기 콘텐츠 키워드를 추출하는 단계;상기 추출된 콘텐츠 키워드의 특징을 대표하는 단어인 상기 콘텐츠 유형을 추출하는 단계; 및상기 콘텐츠 유형 및 상기 콘텐츠 키워드를 장르별로 상기 콘텐츠 온톨로지에 정의하는 단계;를 포함하며,텍스트 마이닝 기법을 이용하여 상기 콘텐츠 온톨로지 생성 단계가 수행되는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
8 8
제 7항에 있어서,상기 중심 벡터 선정 단계는,무작위로 하나의 초기 중심 벡터를 선정하는 단계; 및상기 선정된 중심 벡터에서 가장 멀리 떨어진 노드를 다음 중심 벡터로 선정하는 단계;를 포함하며,상기 초기 중심 벡터 선정 단계와 상기 다음 중심 벡터 선정 단계를 사전에 설정된 개수의 중심 벡터가 선정될 때까지 반복적으로 수행하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
9 9
제 7항에 있어서,상기 단어 필터링 단계는,전체 문서 중에서 해당 단어가 포함된 문서의 빈도수를 나타내는 DF(document frequency) 값을 기준으로 소정 범위 이내에 속하는 단어를 제거하는 단계;한 글자로 이루어진 단어를 제거하는 단계; 및기타 불용어 목록에 포함된 단어를 제거하는 단계;를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
10 10
제 7항에 있어서,상기 노드 평준화 단계에서,상기 각 군집에서 문서의 수를 다음의 [수학식]에 의해 평준화하는 것을 특징으로 이루어진 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법:[수학식]Nnew = N / (log(│N│) + 1),여기서, 상기 Nnew는 평준화된 문서의 수를 나타내며, 상기 N은 상기 문서의 수를 나타낸다
11 11
제 6항에 있어서,상기 핵심 온톨로지 모델링 단계에서
12 12
제 6항에 있어서, 상기 도메인 온톨로지 모델링 단계에서,온톨로지 함의(subsumption) 관계 추론을 통해 상기 핵심 온톨로지 모델링 단계에 의해 모델링된 서로 다른 상기 핵심 온톨로지를 결합하여 상기 도메인 온톨로지를 모델링하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
13 13
삭제
14 14
제 6항에 있어서,상기 새로운 VOD 시놉시스(N) 데이터 분류 단계는,상기 새로운 VOD 시놉시스(N) 데이터로부터 상기 도메인 온톨로지에 정의된 단어 집합을 추출하는 단계;상기 추출된 단어 집합을 기술(description)로 가지는 임시 클래스를 상기 도메인 온톨로지에 생성하는 단계;온톨로지 함의(subsumption) 관계 추론을 이용하여 상기 임시 클래스를 기초로 상기 새로운 VOD 시놉시스(N) 데이터의 콘텐츠 유형 및 장르를 추론하는 단계;를 포함하는 것을 특징으로 하는 부분 워드넷을 결합한 온톨로지에 의한 문서 분류 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 한국 콘텐츠 진흥원 (주) KT 문화 콘텐츠 산업기술 지원사업 지능형 사용자 맞춤 방송 콘텐츠 서비스 기술 개발