맞춤기술찾기

이전대상기술

카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체

  • 기술번호 : KST2015131573
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체가 개시된다. 본 발명에 따른 카테고리 태그 정보를 이용한 웹 페이지 분류 방법은, 분류하고자 하는 웹 페이지로부터 상기 웹 페이지의 구조 정보를 포함하는 카테고리 태그 정보를 추출하는 단계; 상기 추출된 카테고리 태그 정보 및 상기 웹 페이지의 각각의 섹션에 관리자에 의해 미리 설정된 가중치를 부여하는 단계; 상기 부여된 가중치에 따라 상기 웹 페이지를 구성하는 구(phrase)를 이용하여 상기 웹 페이지의 다큐먼트 벡터(document vector)를 생성하는 단계; 상기 웹 페이지의 다큐먼트 벡터와 데이터베이스에 미리 저장된 트리 형태의 자료 구조인 분류 트리(Taxonomy tree)의 각 노드를 구성하는 구를 이용하여 생성된 각 노드의 센트로이드 벡터(centroid vector)의 코사인 유사도(Cosine Similarity) 함수값을 연산함으로써, 상기 웹 페이지와 유사한 복수 개의 노드들을 추출하는 단계; 상기 추출된 복수 개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 단계; 상기 연산된 상대 거리를 이용하여 상대 거리 스코어를 추출하고, 최소 상대 거리 스코어를 가지는 상기 웹 페이지와 가장 유사한 노드를 선정하는 단계; 및 상기 선정된 가장 유사한 노드에 상기 웹 페이지를 부착함으로써 상기 웹 페이지를 분류하는 단계를 포함한다. 본 발명에 의하면, 카테고리 태그의 구조적인 정보를 효과적으로 이용하여 웹 페이지 분류에 적용할 수 있으며, 이와 동시에 추가적인 프로세스를 최소화하는 알고리즘을 제안함으로써, 웹 페이지 분류의 품질 향상을 도모함과 동시에 웹 페이지 분류의 연산 프로세스를 최소화하여 효율적인 웹 페이지 검색에 관한 시스템 구동을 실현할 수 있도록 하는 효과가 있다.
Int. CL G06F 7/08 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/30705(2013.01) G06F 17/30705(2013.01) G06F 17/30705(2013.01) G06F 17/30705(2013.01)
출원번호/일자 1020080082503 (2008.08.22)
출원인 고려대학교 산학협력단
등록번호/일자 10-0954842-0000 (2010.04.19)
공개번호/일자 10-2010-0023630 (2010.03.04) 문서열기
공고번호/일자 (20100428) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.08.22)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이상근 대한민국 서울 동대문구
2 이정진 대한민국 서울특별시 양천구
3 이정현 대한민국 서울특별시 영등포구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 현종철 대한민국 서울특별시 중구 다산로 **, *층 특허법인충현 (신당동, 두지빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 고려대학교 산학협력단 대한민국 서울특별시 성북구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.08.22 수리 (Accepted) 1-1-2008-0600456-92
2 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2008.08.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2008-0615024-22
3 선행기술조사의뢰서
Request for Prior Art Search
2009.01.12 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2009.02.19 수리 (Accepted) 9-1-2009-0012484-77
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.06.09 수리 (Accepted) 4-1-2009-5111177-32
6 의견제출통지서
Notification of reason for refusal
2009.09.30 발송처리완료 (Completion of Transmission) 9-5-2009-0405857-04
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2009.11.25 수리 (Accepted) 1-1-2009-0724080-37
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2009.11.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2009-0724082-28
9 등록결정서
Decision to grant
2010.02.23 발송처리완료 (Completion of Transmission) 9-5-2010-0076702-21
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2010.08.12 수리 (Accepted) 4-1-2010-5149278-93
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.02.11 수리 (Accepted) 4-1-2014-5018243-16
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.04.22 수리 (Accepted) 4-1-2014-5049934-62
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.10.10 수리 (Accepted) 4-1-2019-5210941-09
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
분류하고자 하는 웹 페이지로부터 상기 웹 페이지의 구조 정보를 포함하는 카테고리 태그 정보를 추출하는 단계; 상기 추출된 카테고리 태그 정보 및 상기 웹 페이지의 각각의 섹션에 관리자에 의해 미리 설정된 가중치를 부여하는 단계; 상기 부여된 가중치에 따라 상기 웹 페이지를 구성하는 구(phrase)를 이용하여 상기 웹 페이지의 다큐먼트 벡터(document vector)를 생성하는 단계; 데이터베이스에 미리 저장된 트리 형태의 자료 구조인 분류 트리(Taxonomy tree)의 각 노드를 구성하는 구를 이용하여 생성된 각 노드의 센트로이드 벡터(centroid vector)와 상기 웹 페이지의 다큐먼트 벡터의 코사인 유사도(Cosine Similarity) 함수값을 연산함으로써, 상기 웹 페이지와 유사한 복수 개의 노드들을 추출하는 단계; 상기 추출된 복수 개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 단계; 상기 연산된 상대 거리를 이용하여 상대 거리 스코어를 추출하고, 최소 상대 거리 스코어를 가지는 상기 웹 페이지와 가장 유사한 노드를 선정하는 단계; 및 상기 선정된 가장 유사한 노드에 상기 웹 페이지를 부착함으로써 상기 웹 페이지를 분류하는 단계를 포함하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
2 2
제 1 항에 있어서, 상기 웹 페이지의 각각의 섹션은 제목(title) 및 본문(body)으로 이루어지는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
3 3
제 1 항에 있어서, 상기 분류 트리 상의 상대 거리를 연산하는 단계는 상기 추출된 복수 개의 노드들 중 상기 관리자에 의해 미리 설정된 갯수로 상기 코사인 유사도 함수값이 큰 상위 n개의 노드를 선정하는 단계; 및 상기 상위 n개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 단계를 포함하는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
4 4
제 1 항에 있어서, 상기 웹 페이지의 다큐먼트 벡터는 상기 웹 페이지의 구(phrase), 상기 웹 페이지의 구의 빈도 수 및 상기 미리 부여된 가중치에 의해 구성되는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
5 5
제 1 항에 있어서, 상기 분류 트리 상의 상대 거리를 연산하는 단계는 하나의 노드와 비교하려는 비교 대상 노드가 상기 분류 트리에서 조상-후손 노드 관계인지의 판단하고, 조상-후손 노드 관계가 성립하면 상기 하나의 노드와 상기 비교 대상 노드의 뎁스 차이를 상기 상대 거리로 설정하는 단계; 및 상기 조상-후손 노드 관계가 성립하지 않으면, 상기 하나의 노드와 상기 비교 대상 노드의 공통 부모 노드를 탐색하고, 상기 하나의 노드에서 상기 공통 부모 노드까지의 뎁스 차이, 및 상기 비교 대상 노드에서 상기 공통 부모 노드까지의 뎁이 차이를 합한 값을 상기 상대 거리로 설정하는 단계를 포함하는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
6 6
제 5 항에 있어서, 상기 상대 거리 스코어는 상기 연산된 상대 거리의 제곱합의 제곱근 값으로 설정되는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 방법
7 7
제 1 항 내지 제 6 항의 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
8 8
분류하고자 하는 웹 페이지로부터 상기 웹 페이지의 구조 정보를 포함하는 카테고리 태그 정보를 추출하는 카테고리 태그 정보 추출부; 상기 추출된 카테고리 태그 정보 및 상기 웹 페이지의 각각의 섹션에 관리자에 의해 미리 설정된 가중치를 부여하고, 상기 부여된 가중치에 따라 상기 웹 페이지를 구성하는 구(phrase)를 이용하여 상기 웹 페이지의 다큐먼트 벡터(document vector)를 생성하는 다큐먼트 벡터 생성부; 데이터베이스에 미리 저장된 트리 형태의 자료 구조인 분류 트리(Taxonomy tree)의 각 노드를 구성하는 구를 이용하여 각 노드의 센트로이드 벡터(centroid vector)를 생성하는 센트로이드 벡터 생성부; 상기 웹 페이지의 다큐먼트 벡터와 상기 분류 트리의 각 노드의 센트로이드 벡터(centroid vector)의 코사인 유사도(Cosine Similarity) 함수값을 연산함으로써 상기 웹 페이지와 유사한 복수 개의 노드들을 추출하는 유사 노드 추출부; 상기 추출된 복수 개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 상대 거리 연산부; 및 상기 연산된 상대 거리를 이용하여 상대 거리 스코어를 추출하며, 최소 상대 거리 스코어를 가지는 상기 웹 페이지와 가장 유사한 노드를 선정하고, 상기 선정된 가장 유사한 노드에 상기 웹 페이지를 부착함으로써 상기 웹 페이지를 분류하는 웹 페이지 분류부를 포함하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
9 9
제 8 항에 있어서, 상기 웹 페이지의 각각의 섹션은 제목(title) 및 본문(body)으로 이루어지는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
10 10
제 8 항에 있어서, 상기 상대 거리 연산부는 상기 추출된 복수 개의 노드들 중 상기 관리자에 의해 미리 설정된 갯수로 상기 코사인 유사도 함수값이 큰 상위 n개의 노드를 선정하고, 상기 상위 n개의 노드들 간의 상기 분류 트리 상의 상대 거리를 연산하는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
11 11
제 8 항에 있어서, 상기 웹 페이지의 다큐먼트 벡터는 상기 웹 페이지의 구(phrase), 상기 웹 페이지의 구의 빈도 수 및 상기 미리 부여된 가중치에 의해 구성되는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
12 12
제 8 항에 있어서, 상기 상대 거리 연산부는 하나의 노드와 비교하려는 비교 대상 노드가 상기 분류 트리에서 조상-후손 노드 관계인지의 판단하고, 조상-후손 노드 관계가 성립하면 상기 하나의 노드와 상기 비교 대상 노드의 뎁스 차이를 상기 상대 거리로 설정하고, 상기 조상-후손 노드 관계가 성립하지 않으면, 상기 하나의 노드와 상기 비교 대상 노드의 공통 부모 노드를 탐색하고, 상기 하나의 노드에서 상기 공통 부모 노드까지의 뎁스 차이, 및 상기 비교 대상 노드에서 상기 공통 부모 노드까지의 뎁이 차이를 합한 값을 상기 상대 거리로 설정하는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
13 13
제 8 항에 있어서, 상기 상대 거리 스코어는 상기 연산된 상대 거리의 제곱합의 제곱근 값으로 설정되는 것을 특징으로 하는 카테고리 태그 정보를 이용한 웹 페이지 분류 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.