맞춤기술찾기

이전대상기술

토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버

  • 기술번호 : KST2015000243
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 토픽을 추출하고, 추출된 토픽의 적합성을 평가하는 방법 및 서버가 제공된다. 본 발명의 토픽을 추출하는 서버는, 분류 정보에 따라 구성된 분류별 문서 집합으로부터 명사를 추출한 후 불용어를 제거하는 텍스트 전처리부, 상기 불용어가 제거된 명사에 대해 가중치를 계산하여 상기 분류별 문서 집합을 대표하는 단어인 핵심어를 추출하는 핵심어 추출부, 상기 추출된 핵심어에 대해 가중치를 계산하여 상기 핵심어들을 관련 단어들로 군집화한 군집의 중심 단어인 시드를 선정하는 시드 선정부, 상기 선정된 시드를 중심으로 상기 시드와 동일한 문장에서 다수 출현한 핵심어를 하나의 군집으로 구성하는 초기 군집화부 및 상기 구성된 군집들 중 유사한 군집들을 병합하여 분류별 토픽 집합을 추출하는 군집 병합부를 포함하는 것을 특징으로 한다.
Int. CL G06F 17/21 (2006.01) G06F 17/00 (2006.01) G06F 15/16 (2006.01)
CPC G06F 16/35(2013.01) G06F 16/35(2013.01) G06F 16/35(2013.01)
출원번호/일자 1020140050883 (2014.04.28)
출원인 숭실대학교산학협력단
등록번호/일자 10-1536520-0000 (2015.07.07)
공개번호/일자
공고번호/일자 (20150714) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2014.04.28)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수원 대한민국 서울특별시 동작구
2 노준호 대한민국 서울특별시 동작구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 최관락 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)
2 송인호 대한민국 서울특별시 강남구 강남대로**길 ** (역삼동) 동림빌딩 *층(아이피즈국제특허법률사무소)
3 민영준 대한민국 서울특별시 강남구 남부순환로 ****, *층(도곡동, 차우빌딩)(맥스국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.04.28 수리 (Accepted) 1-1-2014-0405483-47
2 의견제출통지서
Notification of reason for refusal
2015.01.19 발송처리완료 (Completion of Transmission) 9-5-2015-0041321-14
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.03.19 수리 (Accepted) 1-1-2015-0271489-01
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.03.19 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0271490-47
5 등록결정서
Decision to grant
2015.06.30 발송처리완료 (Completion of Transmission) 9-5-2015-0438798-67
6 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2016.06.15 수리 (Accepted) 1-1-2016-0573769-19
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
토픽을 추출하는 서버에 있어서,분류 정보에 따라서 구성된 분류별 문서 집합으로부터 명사를 추출한 후 불용어를 제거하는 텍스트 전처리부;상기 불용어가 제거된 명사에 대해 가중치를 계산하여 상기 분류별 문서 집합을 대표하는 단어인 핵심어를 추출하는 핵심어 추출부;상기 추출된 핵심어에 대해 가중치를 계산하여 상기 핵심어들을 관련 단어들로 군집화한 군집의 중심 단어인 시드를 선정하는 시드 선정부;상기 선정된 시드를 중심으로 상기 시드와 동일한 문장에서 출현한 핵심어를 하나의 군집으로 구성하는 초기 군집화부; 및상기 구성된 군집들 중 유사한 군집들을 병합하여 분류별 토픽 집합을 추출하는 군집 병합부를 포함하는 것을 특징으로 하는 토픽 추출 서버
2 2
제 1 항에 있어서,상기 핵심어는 상기 분류별 문서 집합 중 해당 문서 집합에서 출현한 빈도가 다른 문서 집합들에서 출현한 빈도보다 높은 것을 특징으로 하는 토픽 추출 서버
3 3
제 1 항에 있어서,상기 시드 선정부는,상기 분류별 문서 집합의 문서에서 단어의 출현 빈도와 상기 단어가 출현한 문서 빈도에 근거하여 상기 시드를 선정하는 것을 특징으로 하는 토픽 추출 서버
4 4
제 1 항에 있어서,상기 초기 군집화부는,상기 시드와 핵심어가 상기 분류별 문서 집합에서 동시 출현한 문장의 수를 반영하여 상기 시드와 핵심어의 연관성 값을 계산하고,상기 분류별 문서 집합의 모든 시드에 대해 계산된 연관성 값의 평균 및 표준편차를 반영하여 상기 시드와 핵심어가 하나의 군집으로 구성될 수 있는지 여부를 결정하되,상기 평균 및 표준편차의 임계치(α)를 더 반영하는 것을 특징으로 하는 토픽 추출 서버
5 5
제 1 항에 있어서,상기 군집 병합부는,유사한 두 군집 중 크기가 작은 군집의 단어 수에 대한 두 군집에 공통으로 속한 단어의 수 비율이 유사 군집 병합 임계치(β)보다 큰 조건을 만족하는 경우, 상기 유사한 두 군집을 토픽으로 병합하는 것을 특징으로 하는 토픽 추출 서버
6 6
제 1 항에 있어서,상기 추출된 토픽 집합의 모든 토픽에 대하여 동일 분류의 정답 토픽 집합과 유사성을 계산하고 평균을 취하여, 상기 추출된 토픽이 상기 정답 토픽과 일치하는 정도인 ASP(Average Set Precision)를 계산하는 ASP(Average Set Precision) 계산부;상기 모든 정답 토픽에 대하여 동일 분류의 추출된 토픽과 유사성을 계산하고 평균을 취하여, 상기 정답 토픽이 상기 추출된 토픽 집합에 재현된 정도인 ASR(Average Set Recall)을 계산하는 ASR(Average Set Recall) 계산부; 및상기 ASP와 ASR에 근거하여 상기 추출된 토픽의 적합성인 FAS-measure을 계산하는 적합성 평가부를 더 포함하는 것을 특징으로 하는 토픽 추출 서버
7 7
서버가 토픽을 추출하는 방법에 있어서,(a) 분류 정보에 따라 구성된 분류별 문서 집합으로부터 명사를 추출한 후 불용어를 제거하는 단계;(b) 상기 불용어가 제거된 명사에 대해 가중치를 계산하여 상기 분류별 문서 집합을 대표하는 단어인 핵심어를 추출하는 단계;(c) 상기 추출된 핵심어에 대해 가중치를 계산하여 상기 핵심어들을 관련 단어들로 군집화한 군집의 중심 단어인 시드를 선정하는 단계;(d) 상기 선정된 시드를 중심으로 상기 시드와 동일한 문장에서 출현한 핵심어를 하나의 군집으로 구성하는 단계; 및(e) 상기 구성된 군집들 중 유사한 군집들을 병합하여 분류별 토픽 집합을 추출하는 단계를 포함하는 것을 특징으로 하는 토픽 추출 방법
8 8
제 7 항에 있어서,상기 (d) 단계는,상기 시드와 핵심어가 상기 분류별 문서 집합에서 동시 출현한 문장의 수를 반영하여 상기 시드와 핵심어의 연관성 값을 계산하고,상기 분류별 문서 집합의 모든 시드에 대해 계산된 연관성 값의 평균 및 표준편차를 반영하여 상기 시드와 핵심어가 하나의 군집으로 구성될 수 있는지 여부를 결정하되,상기 평균 및 표준편차의 임계치(α)를 더 반영하는 것을 특징으로 하는 토픽 추출 방법
9 9
제 7 항에 있어서,상기 (e) 단계는,유사한 두 군집 중 크기가 작은 군집의 단어 수에 대한 두 군집에 공통으로 속한 단어의 수 비율이 유사 군집 병합 임계치(β)보다 큰 조건을 만족하는 경우, 상기 유사한 두 군집을 토픽으로 병합하는 것을 특징으로 하는 토픽 추출 방법
10 10
제 7 항에 있어서,(f) 상기 추출된 토픽 집합의 모든 토픽에 대하여 동일 분류의 정답 토픽 집합과 유사성을 계산하고 평균을 취하여, 상기 추출된 토픽이 상기 정답 토픽과 일치하는 정도인 ASP(Average Set Precision)를 계산하는 단계;(g) 상기 모든 정답 토픽에 대하여 동일 분류의 추출된 토픽과 유사성을 계산하고 평균을 취하여, 상기 정답 토픽이 상기 추출된 토픽 집합에 재현된 정도인 ASR(Average Set Recall)을 계산하는 단계; 및(h) 상기 ASP와 ASR에 근거하여 상기 추출된 토픽의 적합성인 FAS-measure을 계산하는 단계를 포함하는 것을 특징으로 하는 토픽 추출 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US10394864 US 미국 FAMILY
2 US20170060997 US 미국 FAMILY
3 WO2015167074 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US10394864 US 미국 DOCDBFAMILY
2 US2017060997 US 미국 DOCDBFAMILY
3 WO2015167074 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 숭실대학교 산학협력단 융합미디어원천기술개발사업 사회문제에 관한 도메인 별 이벤트 추출 및 예측 기술 개발
2 미래창조과학부 숭실대학교 산학협력단 중견연구자지원사업 Open Innovation을 통한 소비자 행동 이론 기반 데이터마이닝 융합 기술 개발
3 산업통상자원부 (주)인우기술 산학융합 연구마을 지원사업 소셜 스트림 기반 속성별제품평판 자동분석 및 검색 솔루션