맞춤기술찾기

이전대상기술

조상 후손 카테고리를 활용한 오픈 디렉터리 프로젝트 기반 텍스트 분류 방법 및 장치

  • 기술번호 : KST2015133599
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 오픈 디렉터리 프로젝트 기반의 텍스트 분류기 생성 방법에 있어서, 오픈 디렉터리 프로젝트의 각 카테고리에 저장된 텍스트 집합을 특징 벡터로 변환하는 단계; 카테고리의 특징 벡터를 이용하여 카테고리의 조상 병합 특징 벡터를 생성하는 단계; 카테고리의 특징 벡터를 이용하여 카테고리의 후손 병합 특징 벡터를 생성하는 단계; 및 카테고리의 특징 벡터, 조상 병합 특징 벡터 및 후손 병합 특징 벡터를 이용하여 조상 후손 병합 특징 벡터를 생성하는 단계를 포함하고, 오픈 디렉터리 프로젝트의 구조는 미리 정의되어 있는 것을 특징으로 한다.
Int. CL G06F 17/00 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01) G06F 17/3069(2013.01)
출원번호/일자 1020140070694 (2014.06.11)
출원인 고려대학교 산학협력단
등록번호/일자 10-1580152-0000 (2015.12.18)
공개번호/일자 10-2015-0066994 (2015.06.17) 문서열기
공고번호/일자 (20160104) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020130152166   |   2013.12.09
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.06.11)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이상근 대한민국 서울특별시 강남구
2 하종우 대한민국 서울특별시 성북구
3 이정현 대한민국 서울특별시 영등포구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인엠에이피에스 대한민국 서울특별시 강남구 테헤란로*길 **, *층 (역삼동, 한동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.06.11 수리 (Accepted) 1-1-2014-0544794-13
2 선행기술조사의뢰서
Request for Prior Art Search
2015.03.10 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2015.05.11 수리 (Accepted) 9-1-2015-0030621-55
4 의견제출통지서
Notification of reason for refusal
2015.06.15 발송처리완료 (Completion of Transmission) 9-5-2015-0397471-47
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.08.10 수리 (Accepted) 1-1-2015-0774307-19
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.08.10 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0774308-65
7 등록결정서
Decision to grant
2015.11.30 발송처리완료 (Completion of Transmission) 9-5-2015-0832952-34
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.10 수리 (Accepted) 4-1-2019-5210941-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
오픈 디렉터리 프로젝트 기반의 텍스트 분류기 생성 방법에 있어서,상기 오픈 디렉터리 프로젝트에 포함된 카테고리에 저장된 텍스트 집합에 기초하여 상기 카테고리의 특징 벡터를 생성하는 단계;상기 생성된 카테고리의 특징 벡터 및 상기 카테고리의 부모 카테고리의 조상 병합 특징 벡터에 대한 가중합에 기초하여 상기 카테고리의 조상 병합 특징 벡터를 생성하는 단계;상기 생성된 카테고리의 특징 벡터 및 상기 카테고리의 자식 카테고리의 후손 병합 특징 벡터에 대한 가중합에 기초하여 상기 카테고리의 후손 병합 특징 벡터를 생성하는 단계; 및상기 생성된 조상 병합 특징 벡터 및 상기 생성된 후손 병합 특징 벡터를 이용하여 상기 카테고리의 조상 후손 병합 특징 벡터를 생성하는 단계를 포함하되, 상기 오픈 디렉터리 프로젝트의 구조는 미리 정의되어 있는 것이며,상기 카테고리의 특징 벡터에 대한 가중치는 상기 부모 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 자식 카테고리의 후손 병합 특징 벡터에 대한 가중치보다 같거나 크게 설정되고, 상기 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 카테고리의 후손 병합 특징 벡터에 대한 가중치는 각각 상이하게 설정되는, 텍스트 분류기 생성 방법
2 2
제 1 항에 있어서,상기 카테고리의 특징 벡터를 생성하는 단계는,상기 카테고리에 속하는 상기 텍스트 집합에서 단어를 추출하는 단계;상기 카테고리에서 추출된 텍스트 별로 단어 발생 빈도 벡터를 생성하는 단계; 및상기 생성된 텍스트 별 단어 발생 빈도 벡터에 기초하여 상기 특징 벡터를 생성하는 단계를 포함하는, 텍스트 분류기 생성 방법
3 3
제 2 항에 있어서,상기 생성된 텍스트 별 단어 발생 빈도 벡터에 기초하여 상기 특징 벡터를 생성하는 단계는, 상기 생성된 텍스트 별 단어 발생 빈도 벡터에 기초하여, 상기 카테고리에 속한 단어 각각의 평균 발생 빈도를 생성하고, 상기 생성된 평균 발생 빈도를 이용하여 상기 특징 벡터를 생성하는 것인, 텍스트 분류기 생성 방법
4 4
제 1 항에 있어서,상기 카테고리의 조상 병합 특징 벡터를 생성하는 단계는,상기 카테고리가 최상위 카테고리인 경우, 상기 카테고리의 특징 벡터를 이용하여 상기 카테고리의 조상 병합 특징 벡터를 생성하는, 텍스트 분류기 생성 방법
5 5
제 1 항에 있어서,상기 카테고리의 후손 병합 특징 벡터를 생성하는 단계는,상기 카테고리가 최말단 카테고리인 경우, 상기 카테고리의 특징 벡터를 이용하여 상기 카테고리의 후손 병합 특징 벡터를 생성하는, 텍스트 분류기 생성 방법
6 6
삭제
7 7
오픈 디렉터리 프로젝트 환경에서 텍스트 분류기를 이용한 텍스트 분류 방법에 있어서,신규 텍스트에 기초하여 특징 벡터를 생성하는 단계; 및상기 생성된 신규 텍스트의 특징 벡터와 상기 텍스트 분류기를 이용하여 상기 신규 텍스트의 카테고리를 분류하는 단계를 포함하되, 상기 텍스트 분류기는 상기 오픈 디렉터리 프로젝트에 포함된 카테고리에 대한 특징 벡터, 상기 카테고리의 조상 병합 특징 벡터 및 상기 카테고리의 후손 병합 특징 벡터를 이용하여 생성된 상기 카테고리의 조상 후손 병합 특징 벡터에 기초하여 구축된 것이고, 상기 카테고리의 조상 병합 특징 벡터는 상기 카테고리의 특징 벡터 및 상기 카테고리의 부모 카테고리의 조상 병합 특징 벡터에 대한 가중합에 기초하여 생성되는 것이고, 상기 카테고리의 후손 병합 특징 벡터는 상기 카테고리의 특징 벡터 및 상기 카테고리의 자식 카테고리의 후손 병합 특징 벡터에 대한 가중합에 기초하여 생성되는 것이며,상기 카테고리의 특징 벡터에 대한 가중치는 상기 부모 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 자식 카테고리의 후손 병합 특징 벡터에 대한 가중치보다 같거나 크게 설정되고, 상기 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 카테고리의 후손 병합 특징 벡터에 대한 가중치는 각각 상이하게 설정되는, 텍스트 분류 방법
8 8
제 7 항에 있어서,상기 카테고리를 분류하는 단계는, 상기 신규 텍스트의 특징 벡터와 상기 오픈 디렉터리 프로젝트에 포함된 각 카테고리의 조상 후손 병합 특징 벡터에 대하여 유사도를 계산하는 단계;상기 유사도가 가장 높은 카테고리를 선택하는 단계; 및 상기 선택하는 단계에서 선택된 카테고리를 상기 신규 텍스트의 카테고리로 분류하는 단계를 포함하는, 텍스트 분류 방법
9 9
카테고리를 분류하는 텍스트 분류기에 있어서,신규 텍스트를 분류하는 프로그램이 저장된 스토리지 장치 및 상기 스토리지 장치에 저장된 상기 텍스트 분류 프로그램을 실행하는 프로세서를 포함하되,상기 프로세서는 상기 프로그램의 실행에 따라, 미리 정의된 오픈 디렉터리 프로젝트 구조에 포함된 카테고리의 특징 벡터, 상기 카테고리의 조상 병합 특징 벡터 및 상기 카테고리의 후손 병합 특징 벡터를 이용하여 상기 카테고리의 조상 후손 병합 특징 벡터를 생성하고, 상기 생성된 카테고리의 조상 후손 병합 특징 벡터를 이용하여 텍스트 분류기를 생성하며, 상기 텍스트 분류기를 이용하여 상기 신규 텍스트의 카테고리를 분류하되,상기 카테고리의 조상 병합 특징 벡터는 상기 카테고리의 특징 벡터 및 상기 카테고리의 부모 카테고리의 조상 병합 특징 벡터에 대한 가중합에 기초하여 생성되는 것이고, 상기 카테고리의 후손 병합 특징 벡터는 상기 카테고리의 특징 벡터 및 상기 카테고리의 자식 카테고리의 후손 병합 특징 벡터에 대한 가중합에 기초하여 생성되는 것이며, 상기 카테고리의 특징 벡터에 대한 가중치는 상기 부모 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 자식 카테고리의 후손 병합 특징 벡터에 대한 가중치보다 같거나 크게 설정되고, 상기 카테고리의 조상 병합 특징 벡터에 대한 가중치 및 상기 카테고리의 후손 병합 특징 벡터에 대한 가중치는 각각 상이하게 설정되는, 텍스트 분류기
10 10
제 9 항에 있어서,상기 프로세서는 상기 카테고리에 포함된 텍스트 집합에서 단어를 추출하고, 상기 추출된 단어에 기초하여 상기 텍스트 집합에 포함된 텍스트 별로 단어 발생 빈도 벡터를 생성하며, 상기 생성된 텍스트 별 단어 발생 빈도 벡터에 기초하여, 상기 카테고리의 특징 벡터를 생성하는, 텍스트 분류기
11 11
제 10 항에 있어서,상기 카테고리의 특징 벡터는 상기 카테고리에 속한 단어에 대한 각각의 평균 발생 빈도를 이용하여 생성되는 것인, 텍스트 분류기
12 12
제 9 항에 있어서,상기 프로세서는 상기 카테고리가 최상위 카테고리일 경우, 상기 카테고리의 특징 벡터를 이용하여 상기 카테고리의 조상 병합 특징 벡터를 생성하는, 텍스트 분류기
13 13
제 9 항에 있어서,상기 프로세서는 상기 카테고리가 최말단 카테고리일 경우, 상기 카테고리의 특징 벡터를 이용하여 상기 카테고리의 후손 병합 특징 벡터를 생성하는, 텍스트 분류기
14 14
삭제
15 15
제 9 항에 있어서,상기 프로세서는 상기 신규 텍스트의 카테고리 분류를 위하여 상기 신규 텍스트의 특징 벡터와 상기 오픈 디렉터리 프로젝트에 포함된 각 카테고리의 조상 후손 병합 특징 벡터에 대하여 유사도를 계산한 후, 상기 유사도가 가장 높은 카테고리를 상기 신규 텍스트의 카테고리로 분류하는, 텍스트 분류기
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.