맞춤기술찾기

이전대상기술

채팅 데이터 학습 및 서비스 방법 및 그에 따른 시스템

  • 기술번호 : KST2015178339
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 사용자 발화 데이터와 시스템 응답 데이터로 이루어진 채팅 말뭉치 데이터를 학습 데이터로 입력받아 사용자 발화 데이터와 시스템 응답 데이터 사이의 색인정보를 생성하는 학습을 이행하며, 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 시스템 응답 데이터와의 상호정보량을 산출하고, 그 상호정보량을 토대로 단문들 중 어느 하나를 선택하여 그 선택된 단문에 대한 데이터와 시스템 응답 데이터로 학습 데이터를 생성하여 재학습을 이행함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있게 한다. 또한 본 발명은 사용자 발화 데이터가 입력되면, 그 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 검출하여 출력하거나, 시스템 응답 데이터가 검출되지 않으며 사용자 발화 데이터가 중문인 경우에는 그 중문을 구성하는 단문들 각각에 대해 대응되는 시스템 응답 데이터들을 검출하고, 그 검출된 시스템 응답 데이터들과 단문 사이의 상호정보량을 산출하고, 그 상호정보량을 토대로 시스템 응답 데이터들 중 어느 하나를 선택하여 출력함으로써, 중문에 대해서도 신뢰할 수 있는 시스템 응답 데이터를 제공할 수 있다.
Int. CL G06Q 50/30 (2012.01) G10L 15/28 (2006.01) G06Q 50/20 (2012.01)
CPC G06Q 50/20(2013.01) G06Q 50/20(2013.01) G06Q 50/20(2013.01)
출원번호/일자 1020130162902 (2013.12.24)
출원인 서강대학교산학협력단, 강원대학교산학협력단
등록번호/일자 10-1590908-0000 (2016.01.27)
공개번호/일자 10-2015-0075191 (2015.07.03) 문서열기
공고번호/일자 (20160203) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.12.24)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 대한민국 서울특별시 마포구
2 강원대학교산학협력단 대한민국 강원도 춘천시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서정연 대한민국 서울 서초구
2 구명완 대한민국 서울특별시 양천구
3 강상우 대한민국 서울 성북구
4 김학수 대한민국 서울 서초구
5 최맹식 대한민국 강원 삼척시 남양
6 송영길 대한민국 강원 춘천시 모수물길 **, *
7 전원표 대한민국 강원 춘천시 미려골

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이지연 대한민국 서울특별시 관악구 남부순환로 ****, ***호 제니스국제특허법률사무소 (봉천동, 청동빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 서강대학교산학협력단 서울특별시 마포구
2 강원대학교산학협력단 강원도 춘천시
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.12.24 수리 (Accepted) 1-1-2013-1185867-60
2 선행기술조사의뢰서
Request for Prior Art Search
2014.07.08 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2014.08.11 수리 (Accepted) 9-1-2014-0063518-88
4 의견제출통지서
Notification of reason for refusal
2015.07.02 발송처리완료 (Completion of Transmission) 9-5-2015-0447939-19
5 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2015.09.02 수리 (Accepted) 1-1-2015-0853154-17
6 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2015.09.02 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2015-0853155-52
7 등록결정서
Decision to grant
2016.01.22 발송처리완료 (Completion of Transmission) 9-5-2016-0058980-03
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.11 수리 (Accepted) 4-1-2017-5005781-67
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.01.22 수리 (Accepted) 4-1-2019-5014626-89
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.05 수리 (Accepted) 4-1-2019-5230938-29
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
색인 데이터베이스와 상호정보량 데이터베이스와 채팅 데이터 학습장치로 구성되는 채팅 데이터 학습 시스템에서의 채팅 데이터 학습 장치에 의해 구현되는 채팅 데이터 학습방법에 있어서, (a) 사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터를 입력받는 단계;(b) 상기 학습 데이터를 이용하여 학습하여, 사용자 발화 데이터의 문장 정보들과 이에 대응되는 시스템 응답 데이터의 색인 정보를 생성하여 색인 데이터베이스에 저장하고, 사용자 발화 데이터의 형태소들과 상기 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하여 상호정보량 데이터베이스에 저장하는 단계;(c) 상기 학습 데이터의 사용자 발화 데이터가 중문인지 여부를 판단하는 단계; 및 (d) 상기 사용자 발화 데이터가 중문이면, 사용자 발화 데이터를 단문으로 분할하고, 분할된 단문들을 이용하여 학습 데이터를 재구성하고, 재구성된 학습 데이터를 이용하여 재학습하여 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 단계;를 구비하며, 상기 (d) 단계는,(d1) 중문인 사용자 발화 데이터에 포함된 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하는 단계;(d2) 상기 연결어미가 종속적 연결어미이면, 상기 분할된 단문들의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량들을 산출하고, 상기 산출된 상호정보량이 가장 큰 단문과 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하는 단계;(d3) 상기 연결어미가 대등적 연결어미이면, 상기 분할된 각 단문들과 상기 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하는 단계; 및 (d4) 상기 재구성된 학습 데이터를 이용하여 학습하여 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 단계;를 구비함을 특징으로 하는 채팅 데이터 학습방법
2 2
제1항에 있어서, 상기 (b) 단계는,(b1) 학습 데이터 중 사용자 발화 데이터에서 형태소를 포함하는 문장정보를 추출하고, 그 문장정보와 상기 시스템 응답 데이터를 매칭시킨 색인정보를 생성하여 색인 데이터베이스에 저장하는 단계; 및 (b2) 상기 사용자 발화 데이터의 형태소들과 상기 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하고, 그 상호정보량을 포함하는 상호정보량 정보를 상호정보량 데이터베이스에 저장하는 단계;를 포함하는 것을 특징으로 하는 채팅 데이터 학습 방법
3 3
제1항에 있어서, 상기 (c) 단계는 사용자 발화 데이터에 연결 어미가 있는지 여부를 판별하고, 연결 어미가 있는 경우 중문이라고 판단하는 것을 특징으로 하는 채팅 데이터 학습 방법
4 4
삭제
5 5
제1항에 있어서, 상기 (b) 단계에서의 상기 상호정보량은, 전체 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들과 시스템 응답 데이터에 속한 제2형태소들이 동시에 출연할 확률을, 현재 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들이 출연할 확률과, 현재 학습 데이터에 대해 시스템 응답 데이터에 속한 제2형태소들이 출연할 확률을 곱한 값으로 나누어 산출함을 특징으로 하는 채팅 데이터 학습방법
6 6
제1항에 있어서, 상기 문장정보는, 모든 품사에 대한 형태소들, 체언 및 용언, 부사에 대한 형태소들, 명사류에 대한 형태소들, 문장특성정보, 연결어미정보가 포함되며, 상기 색인정보는 제1 내지 제3색인정보로 구성되며, 제1색인정보는 모든 품사에 대한 형태소들로 구성되고, 제2색인정보는 체언 및 용언, 부사에 대한 형태소들과 문장특성정보로 구성되고, 제3색인정보는 명사류에 대한 형태소들과 문장특성정보로 구성됨을 특징으로 하는 채팅 데이터 학습방법
7 7
채팅 데이터 학습 시스템에 있어서, 사용자 발화 데이터의 문장정보와 그에 대응되는 시스템 응답 데이터를 매칭시킨 색인정보를 저장하는 색인 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터들 전체에 대해 사용자 발화 데이터의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 포함하는 상호정보량 정보를 저장하는 상호정보량 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터를 이용하여 학습하는 채팅 데이터 학습장치;를 구비하고,상기 채팅 데이터 학습 장치는,사용자 발화 데이터로부터 문장 정보를 추출하고 각 문장 정보와 이에 대응되는 시스템 응답 데이터에 대한 색인 정보를 생성하여 상기 색인 데이터베이스에 저장하는 문장 정보 추출부;사용자 발화 데이터 및 이에 대응되는 시스템 응답 데이터를 구성하는 형태소들 사이의 상호 정보량을 산출하여 상호정보량 데이터베이스에 저장하는 상호정보량 산출부;사용자 발화 데이터가 중문인지 여부를 판별하는 중문 판별부; 및상기 중문 판별부에 의해 중문으로 판별된 사용자 발화 데이터들에 대하여 단문으로 분할하고, 각 단문들을 이용하여 학습 데이터를 재구성하는 중문 처리부;를 구비하고,상기 채팅 데이터 학습 장치는상기 문장정보추출부 및 상기 상호정보량 산출부를 이용하여 학습 데이터에 대하여 학습하여 색인 정보 및 상호정보량을 각각 상기 색인 데이터베이스 및 상호정보량 데이터베이스에 저장하고,상기 중문 판별부를 이용하여 중문으로 구성된 사용자 발화 데이터를 판별하고, 상기 중문 처리부를 이용하여 학습 데이터를 재구성하고, 재구성된 학습 데이터에 대하여 다시 학습하여 상기 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 것이며, 상기 중문 처리부는 제1 및 제2 중문 처리부로 구성되며, 상기 중문 판별부는 사용자 발화 데이터에 종속적 연결어미가 포함된 경우 제1 중문 처리부를 구동하고, 사용자 발화 데이터에 대등적 연결어미가 포함된 경우제2 중문 처리부를 구동하며,상기 제1 중문 처리부는, 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 단문들의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하고, 그 상호정보량이 가장 큰 단문과 이에 대응하는 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하며,상기 제2 중문 처리부는, 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 단문들과 상기 시스템 응답 데이터를 결합하여 학습 데이터들을 재구성함을 특징으로 하는 채팅 데이터 학습 시스템
8 8
제7항에 있어서, 상기 중문 판별부는 사용자 발화 데이터에 연결어미가 포함되었는지 여부를 판별하고, 연결어미가 포함된 경우 중문으로 판단하는 것을 특징으로 하는 채팅 데이터 학습 시스템
9 9
삭제
10 10
제7항에 있어서, 상기 상호정보량 산출부는, 전체 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들과 시스템 응답 데이터에 속한 제2형태소들이 동시에 출연할 확률을, 현재 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들이 출연할 확률과, 현재 학습 데이터에 대해 시스템 응답 데이터에 속한 제2형태소들이 출연할 확률을 곱한 값으로 나누어 상호정보량을 산출함을 특징으로 하는 채팅 데이터 학습 시스템
11 11
제7항에 있어서, 상기 문장정보는, 모든 품사에 대한 형태소들, 체언 및 용언, 부사에 대한 형태소들, 명사류에 대한 형태소들, 문장특성정보, 연결어미정보가 포함되며, 상기 색인정보는 제1 내지 제3색인정보로 구성되며, 제1색인정보는 모든 품사에 대한 형태소들로 구성되고, 제2색인정보는 체언 및 용언, 부사에 대한 형태소들과 문장특성정보로 구성됨을 특징으로 하는 채팅 데이터 학습 시스템
12 12
색인 데이터베이스와 상호 정보량 데이터베이스와 채팅 데이터 서비스 장치를 포함하는 채팅 데이터 서비스 시스템에서의 채팅 데이터 서비스 장치에 의해 구현되는 채팅 데이터 서비스 방법에 있어서, (a) 외부로부터 사용자 발화 데이터를 입력받는 단계;(b) 상기 입력된 사용자 발화 데이터의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터를 색인 데이터베이스에 저장된 색인정보에서 검출하여 출력하는 단계;(c) 상기 문장정보에 대응되는 시스템 응답 데이터가 검출되지 않으면, 그 사용자 발화 데이터가 중문인지 여부를 판별하는 단계; 및 (d) 상기 사용자 발화 데이터가 중문이면, 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 검출하고, 상기 상호정보량을 이용하여 시스템 응답 데이터를 선택하여 출력하는 단계;를 구비하며, 상기 (d) 단계는(d1) 상기 사용자 발화 데이터가 종속적 연결 어미로 연결된 중문인지 대등적 연결어미로 연결된 중문인지 판별하는 단계;(d2) 상기 사용자 발화 데이터가 종속적 연결어미로 연결된 중문이면, 상기 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 검출하고, 그 상호정보량이 가장 큰 시스템 응답 데이터를 선택하여 출력하는 단계; 및(d3) 상기 사용자 발화 데이터가 대등적 연결어미로 연결된 중문이면, 상기 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보들에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 상기 검출된 시스템 응답 데이터들을 출력하는 단계;를 구비함을 특징으로 하는 채팅 데이터 서비스 방법
13 13
제12항에 있어서, 상기 (c) 단계는상기 사용자 발화 데이터에 연결어미가 있는지 여부를 판별하고, 연결어미가 있는 경우 중문으로 판단하는 것을 특징으로 하는 채팅 데이터 서비스 방법
14 14
삭제
15 15
채팅 데이터 서비스 시스템에 있어서, 사용자 발화 데이터의 문장정보와 그에 대응되는 시스템 응답 데이터를 매칭시킨 색인정보를 저장하는 색인 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터들 전체에 대해 사용자 발화 데이터의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출한 상호정보량 정보를 저장하는 상호정보량 데이터베이스; 및 외부로부터 사용자 발화 데이터가 입력되면, 색인 데이터베이스 및 상호정보량 데이터베이스를 이용하여, 상기 입력된 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 추출하여 제공하는 채팅 데이터 서비스 장치;를 구비하고,상기 채팅 데이터 서비스 장치는, 외부로부터 입력된 사용자 발화 데이터로부터 문장 정보를 추출하고, 추출된 문장정보에 대응되는 시스템 응답 데이터를 색인 데이터베이스에 저장된 색인정보에서 검출하여 출력하고, 상기 문장정보에 대응되는 시스템 응답 데이터가 검출되지 않으면, 그 사용자 발화 데이터가 중문인지를 판별하고, 상기 사용자 발화 데이터가 중문이면, 상기 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 상기 검출된 시스템 응답 데이터들 중 적어도 하나 이상을 출력하는 것이며, 상기 채팅 데이터 서비스 장치가, 상기 사용자 발화 데이터가 종속적 연결어미로 연결된 중문이면 상기 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 상기 상호정보량 데이터베이스에서 검출하고, 상호정보량이 가장 큰 시스템 응답 데이터를 선택하여 출력하고, 상기 사용자 발화 데이터가 대등적 연결어미로 연결된 중문이면, 상기 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보들에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들을 출력함을 특징으로 하는 채팅 데이터 서비스 시스템
16 16
삭제
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2015099418 WO 세계지적재산권기구(WIPO) FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 WO2015099418 WO 세계지적재산권기구(WIPO) DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 산업통산자원부 서강대학교 산학협력단 다중영역 정보서비스를 위한 대화형 개인 비서 소프트웨어 원천 기술 개발 다중영역 정보서비스를 위한 대화형 개인 비서 소프트웨어 원천 기술 개발