맞춤기술찾기

이전대상기술

블로그 문서에서의 경험 문장 추출 방법 및 동사 분류 방법

  • 기술번호 : KST2015118175
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 블로그 문서에 기록된 문장에서 사용자의 경험을 나타내는 문장을 추출하는 방법과, 활동동사와 상태동사를 분류하는 방법에 관한 것으로서, 본 발명의 블로그 문서에서의 경험 문장 추출 방법은 문법적 자질들을 기반으로 하는 기계학습 방법 알고리즘을 이용하여 문장 분류기를 생성하는 단계 및 상기 문장 분류기를 이용하여 블로그 문서 내에서 사용자의 실제 경험을 나타내는 문장인 경험문장과, 경험을 나타내지 않는 문장인 비경험 문장을 분류하는 단계를 포함한다. 본 발명에 의하면, 블로그 문서 내 문장들을 경험 문장과 비 경험 문장으로 분류함으로써, 문서 내 실제 사용자가 행하거나 사용자에게 일어난 경험들을 추출할 수 있는 효과가 있다.
Int. CL G06F 17/25 (2006.01) G06F 17/30 (2006.01)
CPC G06F 17/2785(2013.01) G06F 17/2785(2013.01)
출원번호/일자 1020100130178 (2010.12.17)
출원인 한국과학기술원
등록번호/일자 10-1265467-0000 (2013.05.10)
공개번호/일자 10-2012-0068519 (2012.06.27) 문서열기
공고번호/일자 (20130516) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2010.12.17)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 맹성현 대한민국 대전광역시 유성구
2 박근찬 대한민국 대전광역시 유성구
3 정윤재 대한민국 경기도 고양시 일산동구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인세아 대한민국 서울특별시 금천구 가산디지털*로 **, *동 ****호(가산동, 롯데IT캐슬)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대전광역시 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2010.12.17 수리 (Accepted) 1-1-2010-0835735-28
2 선행기술조사의뢰서
Request for Prior Art Search
2012.03.13 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2012.04.19 수리 (Accepted) 9-1-2012-0029555-01
4 의견제출통지서
Notification of reason for refusal
2012.05.31 발송처리완료 (Completion of Transmission) 9-5-2012-0316271-87
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2012.07.27 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2012-0601206-91
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2012.07.27 수리 (Accepted) 1-1-2012-0601204-00
7 의견제출통지서
Notification of reason for refusal
2012.11.26 발송처리완료 (Completion of Transmission) 9-5-2012-0714703-34
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2013.01.28 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2013-0081477-27
9 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2013.01.28 수리 (Accepted) 1-1-2013-0081476-82
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2013.02.01 수리 (Accepted) 4-1-2013-5019983-17
11 등록결정서
Decision to grant
2013.04.30 발송처리완료 (Completion of Transmission) 9-5-2013-0296044-05
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157968-69
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5157993-01
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.12.24 수리 (Accepted) 4-1-2014-5158129-58
15 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.04.24 수리 (Accepted) 4-1-2019-5081392-49
16 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
17 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문법적 자질들을 기반으로 하는 기계학습 방법 알고리즘을 이용하여 문장 분류기를 생성하는 단계; 및상기 문장 분류기를 이용하여 블로그 문서 내에서 사용자의 실제 경험을 나타내는 문장인 경험문장과, 경험을 나타내지 않는 문장인 비경험문장을 분류하는 단계로서, 상기 블로그 문서의 텍스트를 전처리하는 단계와, 전처리된 상기 블로그 문서에서 문법적 자질들을 추출하는 단계와, 추출된 상기 문법적 자질들을 기반으로 상기 문장 분류기를 이용하여 상기 블로그 문서 내에서 경험문장과 비경험문장을 분류하는 단계를 포함하는 상기 문장 분류기를 이용하여 경험문장과 비경험문장을 분류하는 단계를 포함하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
2 2
제1항에 있어서,상기 문장 분류기를 생성하는 단계는,주어진 학습 데이터로부터 문법적 자질들을 추출하는 단계; 및추출된 문법적 자질들을 기반으로 하는 기계학습 방법 알고리즘을 이용하여 문장을 분류하기 위한 문장 분류기를 생성하는 단계를 포함하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
3 3
제1항에 있어서,상기 기계학습 방법 알고리즘은 SVM(Support Vector Machine) 알고리즘인 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
4 4
제2항에 있어서,상기 학습 데이터로부터 문법적 자질들을 추출하는 단계는, 상기 학습 데이터에 포함된 문장으로부터 시제(時制, tense)를 추출하는 단계와,상기 문장으로부터 서법(敍法, mood)을 추출하는 단계와,상기 문장으로부터 상(相, aspect)을 추출하는 단계와,상기 문장으로부터 법성(法性, modality)을 추출하는 단계와,상기 문장으로부터 경험자(experiencer)를 추출하는 단계와,상기 문장으로부터 동사 클래스를 추출하는 단계를 포함하여 이루어지는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
5 5
제4항에 있어서,상기 시제를 추출하는 단계는 품사(part of speech) 태깅을 이용하여 시제를 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
6 6
제4항에 있어서,상기 서법을 추출하는 단계는 문장부호와 문장 내 품사 순서를 이용하여 서법을 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
7 7
제4항에 있어서,상기 상을 추출하는 단계는 품사 태깅을 이용하여 상을 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
8 8
제4항에 있어서,상기 법성을 추출하는 단계는 품사 태깅과 법성 동사 사전을 이용하여 법성을 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
9 9
제4항에 있어서,상기 경험자를 추출하는 단계는 파싱(parsing)과 개체명 인식기(named entity recognizer)를 이용하여 경험자를 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
10 10
제4항에 있어서,상기 동사 클래스를 추출하는 단계는 활동(activity) 동사 사전을 이용하여 동사 클래스를 추출하는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
11 11
삭제
12 12
제1항에 있어서,상기 블로그 문서의 텍스트를 전처리하는 단계는,상기 블로그 문서에 대하여 HTML 파싱 및 문장 토큰화 과정을 거치는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
13 13
제1항에 있어서,상기 전처리된 블로그 문서에서 문법적 자질들을 추출하는 단계는, 문법적 자질을 추출하고자 하는 문장에 대해 품사를 태깅하는 단계와,상기 문법적 자질을 추출하고자 하는 문장에 대해 파싱하는 단계와,상기 문법적 자질을 추출하고자 하는 문장에 대해 개체명을 인식하는 단계와,문법적 자질을 추출하기 위한 사전을 로드하는 단계와,상기 사전을 이용하여 문장에서 시제, 상, 서법, 법성, 경험자, 동사 클래스 자질을 추출하는 단계를 포함하여 이루어지는 것을 특징으로 하는 블로그 문서에서의 경험 문장 추출 방법
14 14
사람의 행위, 활동을 나타내는 활동(activity) 동사와, 사람의 감정, 인지를 나타내는 상태(state) 동사를 포함하는 학습동사 셋(set)으로부터 통계적 자질들을 추출하는 단계와;상기 통계적 자질들을 기반으로 하는 기계학습 방법 알고리즘을 이용하여 동사 분류기를 생성하는 단계; 및상기 동사 분류기를 이용하여 블로그 문서 내에 주어진 동사가 활동 동사인지 상태 동사인지를 판별하는 단계를 포함하는 블로그 문서에서의 동사 분류 방법
15 15
삭제
16 16
제14항에 있어서,상기 통계적 자질들을 추출하는 단계는,상기 주어진 동사에 대하여 상기 통계적 자질들을 추출하기 위한 검색 쿼리를 생성하는 단계와,상기 쿼리에 대한 통계적 수치를 검색엔진으로부터 추출하는 단계를 포함하는 것을 특징으로 하는 블로그 문서에서의 동사 분류 방법
17 17
제16항에 있어서,상기 쿼리를 생성하는 단계는, 벤들러(Vendler) 동사이론 테스트 패턴을 이용하여 쿼리를 생성하는 것을 특징으로 하는 블로그 문서에서의 동사 분류 방법
18 18
제16항에 있어서,상기 쿼리에 대한 통계적 수치를 검색엔진으로부터 추출하는 단계는, 검색엔진 API와 정규식을 이용하여 통계적 수치를 추출하는 것을 특징으로 하는 블로그 문서에서의 동사 분류 방법
19 19
제14항에 있어서,상기 기계학습 방법 알고리즘은 SVM(Support Vector Machine) 알고리즘인 것을 특징으로 하는 블로그 문서에서의 동사 분류 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 한국과학기술원 장소/사회적 관계 인지형 Social 미디어 서비스 기술 Urban Computing Middleware 기술 개발