맞춤기술찾기

이전대상기술

토픽 추출 장치 및 방법, 이를 수행하기 위한 기록 매체(METHOD AND DEVICE FOR EXTRACTING TOPIC, RECORDING MEDIUM FOR PERFORMING THE METHOD)

  • 기술번호 : KST2017018796
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 토픽 추출 장치 및 방법, 이를 수행하기 위한 기록 매체를 개시한다. 본 발명의 일 측면에 따른 토픽 추출 장치는, 문서에 포함된 텍스트 데이터를 전처리하는 전처리부; 상기 전처리된 텍스트 데이터를 잠재 디리클레 할당을 이용하여 토픽을 추출하는 토픽 추출부; 및 상기 추출된 토픽의 단어 집합 중 토픽의 의미를 대표적으로 표현하는 단어를 찾아 상기 토픽의 레이블로 지정하는 토픽 레이블링부;를 포함한다.
Int. CL G06F 17/30 (2016.08.05) G06Q 50/10 (2016.08.05)
CPC G06F 16/335(2013.01) G06F 16/335(2013.01) G06F 16/335(2013.01) G06F 16/335(2013.01)
출원번호/일자 1020160084881 (2016.07.05)
출원인 숭실대학교산학협력단
등록번호/일자
공개번호/일자 10-2017-0141570 (2017.12.26) 문서열기
공고번호/일자 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020160074689   |   2016.06.15
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.07.05)
심사청구항수 11

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 대한민국 서울특별시 동작구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이수원 대한민국 서울시 서초구
2 김희찬 대한민국 서울특별시 동작구
3 김종훈 대한민국 서울특별시 동작구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤귀상 대한민국 서울특별시 금천구 디지털로*길 ** ***호 (가산동, 한신IT타워*차)(디앤특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 숭실대학교산학협력단 서울특별시 동작구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.07.05 수리 (Accepted) 1-1-2016-0650616-83
2 [출원서등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2016.07.05 수리 (Accepted) 1-1-2016-0651684-45
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.08.04 수리 (Accepted) 4-1-2016-5110636-51
4 의견제출통지서
Notification of reason for refusal
2017.04.20 발송처리완료 (Completion of Transmission) 9-5-2017-0285784-53
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.06.08 수리 (Accepted) 1-1-2017-0544269-68
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.06.08 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-0544270-15
7 거절결정서
Decision to Refuse a Patent
2017.10.31 발송처리완료 (Completion of Transmission) 9-5-2017-0759258-99
8 [명세서등 보정]보정서(재심사)
Amendment to Description, etc(Reexamination)
2017.11.29 보정승인 (Acceptance of amendment) 1-1-2017-1190641-15
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.11.29 수리 (Accepted) 1-1-2017-1190640-70
10 등록결정서
Decision to Grant Registration
2017.12.27 발송처리완료 (Completion of Transmission) 9-5-2017-0906555-59
11 [일부 청구항 포기]취하(포기)서
[Abandonment of Partial Claims] Request for Withdrawal (Abandonment)
2017.12.28 수리 (Accepted) 2-1-2017-0826240-61
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문서에 포함된 텍스트 데이터를 전처리하는 전처리부;상기 전처리된 텍스트 데이터를 잠재 디리클레 할당을 이용하여 토픽을 추출하는 토픽 추출부; 및상기 추출된 토픽의 단어 집합 중 토픽의 의미를 대표적으로 표현하는 단어를 찾아 상기 토픽의 레이블로 지정하는 토픽 레이블링부;를 포함하되,상기 토픽 레이블링부는,상기 전처리된 텍스트 데이터를 Word2vec 알고리즘으로 학습하여 모든 단어를 벡터값으로 추출하여 표현하는 벡터값 추출부; 및상기 추출된 벡터값 중에서 토픽 내의 단어 집합의 벡터값으로 토픽 내의 단어 간 거리를 계산하는 단어 간 거리 계산부;를 포함하는 토픽 추출 장치
2 2
제 1 항에 있어서,상기 전처리부는,문서에 포함된 텍스트 데이터에서 문장을 분리하여 형태소별로 태깅하는 형태소 분석부;상기 형태소별로 태깅된 결과 중 명사만 추출하는 명사 추출부; 및상기 추출된 명사 중에서 불용어를 제거하는 불용어 제거부;를 포함하는 토픽 추출 장치
3 3
삭제
4 4
제 1 항에 있어서,상기 단어 간 거리 계산부는,토픽별 단어들의 벡터값을 이용하여 추출된 토픽 단어의 벡터값으로 중앙값을 구하고, 상기 계산된 중앙값으로부터 가장 가까운 벡터값을 구하여 토픽 내의 단어 간 거리를 계산하는 토픽 추출 장치
5 5
[청구항 5은(는) 설정등록료 납부시 포기되었습니다
6 6
[청구항 6은(는) 설정등록료 납부시 포기되었습니다
7 7
토픽 추출 장치에서의 토픽 추출 방법에 있어서,문서에 포함된 텍스트 데이터를 전처리하는 전처리 단계;상기 전처리된 텍스트 데이터를 LDA를 이용하여 토픽을 추출하는 토픽 추출 단계; 및상기 추출된 토픽의 단어 집합 중 토픽의 의미를 대표적으로 표현하는 단어를 찾아 상기 토픽의 레이블로 지정하는 토픽 레이블링 단계;를 포함하되,상기 토픽 레이블링 단계는,상기 전처리된 텍스트 데이터를 Word2vec 알고리즘으로 학습하여 모든 단어를 벡터값으로 추출하여 표현하는 벡터값 추출 단계; 및상기 추출된 벡터값 중에서 토픽 내의 단어 집합의 벡터값으로 토픽 내의 단어 간 거리를 계산하는 단어 간 거리 계산 단계;를 포함하는 토픽 추출 방법
8 8
제 7 항에 있어서,상기 전처리 단계는,문서에 포함된 텍스트 데이터에서 문장을 분리하여 형태소별로 태깅하는 형태소 분석 단계;상기 형태소별로 태깅된 결과 중 명사만 추출하는 명사 추출 단계; 및상기 추출된 명사 중에서 불용어를 제거하는 불용어 제거 단계;를 포함하는 토픽 추출 방법
9 9
삭제
10 10
제 7 항에 있어서,상기 단어 간 거리 계산 단계는,토픽별 단어들의 벡터값을 이용하여 추출된 토픽 단어의 벡터값으로 중앙값을 구하고, 상기 계산된 중앙값으로부터 가장 가까운 벡터값을 구하여 토픽 내의 단어 간 거리를 계산하는 토픽 추출 방법
11 11
제 10 항에 있어서,상기 중앙값은, 토픽별 단어집합이 n개의 단어로 구성될 경우, n번째까지의 단어 벡터값들의 총합을 상기 토픽별 단어집합에 포함된 n개의 단어 개수로 나누어 산출되는 토픽 추출 방법
12 12
제 11 항에 있어서,상기 토픽 내의 단어 간 거리는,차원(dimension)이 k일 경우, 1부터 k번째까지의 중앙값의 k차원의 값과 토픽 내 특정 단어의 k차원의 값의 차를 제곱하여 합산한 값을 거듭 제곱하여 산출되는 토픽 추출 방법
13 13
제 7 항, 제8항, 제10항 내지 제 12 항 중 어느 한 항에 따른 토픽 추출 방법을 수행하기 위한, 컴퓨터 프로그램이 기록된 컴퓨터로 판독 가능한 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 숭실대학교 산학협력단 방송통신융합미디어원천기술개발 사회문제에 관한 도메인별 이벤트 추출 및 예측 기술 개발