1 |
1
색인 데이터베이스와 상호정보량 데이터베이스와 채팅 데이터 학습장치로 구성되는 채팅 데이터 학습 시스템에서의 채팅 데이터 학습 장치에 의해 구현되는 채팅 데이터 학습방법에 있어서, (a) 사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터를 입력받는 단계;(b) 상기 학습 데이터를 이용하여 학습하여, 사용자 발화 데이터의 문장 정보들과 이에 대응되는 시스템 응답 데이터의 색인 정보를 생성하여 색인 데이터베이스에 저장하고, 사용자 발화 데이터의 형태소들과 상기 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하여 상호정보량 데이터베이스에 저장하는 단계;(c) 상기 학습 데이터의 사용자 발화 데이터가 중문인지 여부를 판단하는 단계; 및 (d) 상기 사용자 발화 데이터가 중문이면, 사용자 발화 데이터를 단문으로 분할하고, 분할된 단문들을 이용하여 학습 데이터를 재구성하고, 재구성된 학습 데이터를 이용하여 재학습하여 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 단계;를 구비하며, 상기 (d) 단계는,(d1) 중문인 사용자 발화 데이터에 포함된 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하는 단계;(d2) 상기 연결어미가 종속적 연결어미이면, 상기 분할된 단문들의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량들을 산출하고, 상기 산출된 상호정보량이 가장 큰 단문과 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하는 단계;(d3) 상기 연결어미가 대등적 연결어미이면, 상기 분할된 각 단문들과 상기 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하는 단계; 및 (d4) 상기 재구성된 학습 데이터를 이용하여 학습하여 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 단계;를 구비함을 특징으로 하는 채팅 데이터 학습방법
|
2 |
2
제1항에 있어서, 상기 (b) 단계는,(b1) 학습 데이터 중 사용자 발화 데이터에서 형태소를 포함하는 문장정보를 추출하고, 그 문장정보와 상기 시스템 응답 데이터를 매칭시킨 색인정보를 생성하여 색인 데이터베이스에 저장하는 단계; 및 (b2) 상기 사용자 발화 데이터의 형태소들과 상기 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하고, 그 상호정보량을 포함하는 상호정보량 정보를 상호정보량 데이터베이스에 저장하는 단계;를 포함하는 것을 특징으로 하는 채팅 데이터 학습 방법
|
3 |
3
제1항에 있어서, 상기 (c) 단계는 사용자 발화 데이터에 연결 어미가 있는지 여부를 판별하고, 연결 어미가 있는 경우 중문이라고 판단하는 것을 특징으로 하는 채팅 데이터 학습 방법
|
4 |
4
삭제
|
5 |
5
제1항에 있어서, 상기 (b) 단계에서의 상기 상호정보량은, 전체 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들과 시스템 응답 데이터에 속한 제2형태소들이 동시에 출연할 확률을, 현재 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들이 출연할 확률과, 현재 학습 데이터에 대해 시스템 응답 데이터에 속한 제2형태소들이 출연할 확률을 곱한 값으로 나누어 산출함을 특징으로 하는 채팅 데이터 학습방법
|
6 |
6
제1항에 있어서, 상기 문장정보는, 모든 품사에 대한 형태소들, 체언 및 용언, 부사에 대한 형태소들, 명사류에 대한 형태소들, 문장특성정보, 연결어미정보가 포함되며, 상기 색인정보는 제1 내지 제3색인정보로 구성되며, 제1색인정보는 모든 품사에 대한 형태소들로 구성되고, 제2색인정보는 체언 및 용언, 부사에 대한 형태소들과 문장특성정보로 구성되고, 제3색인정보는 명사류에 대한 형태소들과 문장특성정보로 구성됨을 특징으로 하는 채팅 데이터 학습방법
|
7 |
7
채팅 데이터 학습 시스템에 있어서, 사용자 발화 데이터의 문장정보와 그에 대응되는 시스템 응답 데이터를 매칭시킨 색인정보를 저장하는 색인 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터들 전체에 대해 사용자 발화 데이터의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 포함하는 상호정보량 정보를 저장하는 상호정보량 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터를 이용하여 학습하는 채팅 데이터 학습장치;를 구비하고,상기 채팅 데이터 학습 장치는,사용자 발화 데이터로부터 문장 정보를 추출하고 각 문장 정보와 이에 대응되는 시스템 응답 데이터에 대한 색인 정보를 생성하여 상기 색인 데이터베이스에 저장하는 문장 정보 추출부;사용자 발화 데이터 및 이에 대응되는 시스템 응답 데이터를 구성하는 형태소들 사이의 상호 정보량을 산출하여 상호정보량 데이터베이스에 저장하는 상호정보량 산출부;사용자 발화 데이터가 중문인지 여부를 판별하는 중문 판별부; 및상기 중문 판별부에 의해 중문으로 판별된 사용자 발화 데이터들에 대하여 단문으로 분할하고, 각 단문들을 이용하여 학습 데이터를 재구성하는 중문 처리부;를 구비하고,상기 채팅 데이터 학습 장치는상기 문장정보추출부 및 상기 상호정보량 산출부를 이용하여 학습 데이터에 대하여 학습하여 색인 정보 및 상호정보량을 각각 상기 색인 데이터베이스 및 상호정보량 데이터베이스에 저장하고,상기 중문 판별부를 이용하여 중문으로 구성된 사용자 발화 데이터를 판별하고, 상기 중문 처리부를 이용하여 학습 데이터를 재구성하고, 재구성된 학습 데이터에 대하여 다시 학습하여 상기 색인 데이터베이스 및 상호정보량 데이터베이스를 갱신하는 것이며, 상기 중문 처리부는 제1 및 제2 중문 처리부로 구성되며, 상기 중문 판별부는 사용자 발화 데이터에 종속적 연결어미가 포함된 경우 제1 중문 처리부를 구동하고, 사용자 발화 데이터에 대등적 연결어미가 포함된 경우제2 중문 처리부를 구동하며,상기 제1 중문 처리부는, 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 단문들의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출하고, 그 상호정보량이 가장 큰 단문과 이에 대응하는 시스템 응답 데이터를 결합하여 학습 데이터를 재구성하며,상기 제2 중문 처리부는, 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 단문들과 상기 시스템 응답 데이터를 결합하여 학습 데이터들을 재구성함을 특징으로 하는 채팅 데이터 학습 시스템
|
8 |
8
제7항에 있어서, 상기 중문 판별부는 사용자 발화 데이터에 연결어미가 포함되었는지 여부를 판별하고, 연결어미가 포함된 경우 중문으로 판단하는 것을 특징으로 하는 채팅 데이터 학습 시스템
|
9 |
9
삭제
|
10 |
10
제7항에 있어서, 상기 상호정보량 산출부는, 전체 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들과 시스템 응답 데이터에 속한 제2형태소들이 동시에 출연할 확률을, 현재 학습 데이터에 대해 사용자 발화 데이터에 속한 제1형태소들이 출연할 확률과, 현재 학습 데이터에 대해 시스템 응답 데이터에 속한 제2형태소들이 출연할 확률을 곱한 값으로 나누어 상호정보량을 산출함을 특징으로 하는 채팅 데이터 학습 시스템
|
11 |
11
제7항에 있어서, 상기 문장정보는, 모든 품사에 대한 형태소들, 체언 및 용언, 부사에 대한 형태소들, 명사류에 대한 형태소들, 문장특성정보, 연결어미정보가 포함되며, 상기 색인정보는 제1 내지 제3색인정보로 구성되며, 제1색인정보는 모든 품사에 대한 형태소들로 구성되고, 제2색인정보는 체언 및 용언, 부사에 대한 형태소들과 문장특성정보로 구성됨을 특징으로 하는 채팅 데이터 학습 시스템
|
12 |
12
색인 데이터베이스와 상호 정보량 데이터베이스와 채팅 데이터 서비스 장치를 포함하는 채팅 데이터 서비스 시스템에서의 채팅 데이터 서비스 장치에 의해 구현되는 채팅 데이터 서비스 방법에 있어서, (a) 외부로부터 사용자 발화 데이터를 입력받는 단계;(b) 상기 입력된 사용자 발화 데이터의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터를 색인 데이터베이스에 저장된 색인정보에서 검출하여 출력하는 단계;(c) 상기 문장정보에 대응되는 시스템 응답 데이터가 검출되지 않으면, 그 사용자 발화 데이터가 중문인지 여부를 판별하는 단계; 및 (d) 상기 사용자 발화 데이터가 중문이면, 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 검출하고, 상기 상호정보량을 이용하여 시스템 응답 데이터를 선택하여 출력하는 단계;를 구비하며, 상기 (d) 단계는(d1) 상기 사용자 발화 데이터가 종속적 연결 어미로 연결된 중문인지 대등적 연결어미로 연결된 중문인지 판별하는 단계;(d2) 상기 사용자 발화 데이터가 종속적 연결어미로 연결된 중문이면, 상기 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 검출하고, 그 상호정보량이 가장 큰 시스템 응답 데이터를 선택하여 출력하는 단계; 및(d3) 상기 사용자 발화 데이터가 대등적 연결어미로 연결된 중문이면, 상기 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보들에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 상기 검출된 시스템 응답 데이터들을 출력하는 단계;를 구비함을 특징으로 하는 채팅 데이터 서비스 방법
|
13 |
13
제12항에 있어서, 상기 (c) 단계는상기 사용자 발화 데이터에 연결어미가 있는지 여부를 판별하고, 연결어미가 있는 경우 중문으로 판단하는 것을 특징으로 하는 채팅 데이터 서비스 방법
|
14 |
14
삭제
|
15 |
15
채팅 데이터 서비스 시스템에 있어서, 사용자 발화 데이터의 문장정보와 그에 대응되는 시스템 응답 데이터를 매칭시킨 색인정보를 저장하는 색인 데이터베이스;사용자 발화 데이터와 시스템 응답 데이터로 구성되는 학습 데이터들 전체에 대해 사용자 발화 데이터의 형태소들과 시스템 응답 데이터의 형태소들 사이의 상호정보량을 산출한 상호정보량 정보를 저장하는 상호정보량 데이터베이스; 및 외부로부터 사용자 발화 데이터가 입력되면, 색인 데이터베이스 및 상호정보량 데이터베이스를 이용하여, 상기 입력된 사용자 발화 데이터에 대응되는 시스템 응답 데이터를 추출하여 제공하는 채팅 데이터 서비스 장치;를 구비하고,상기 채팅 데이터 서비스 장치는, 외부로부터 입력된 사용자 발화 데이터로부터 문장 정보를 추출하고, 추출된 문장정보에 대응되는 시스템 응답 데이터를 색인 데이터베이스에 저장된 색인정보에서 검출하여 출력하고, 상기 문장정보에 대응되는 시스템 응답 데이터가 검출되지 않으면, 그 사용자 발화 데이터가 중문인지를 판별하고, 상기 사용자 발화 데이터가 중문이면, 상기 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 상기 검출된 시스템 응답 데이터들 중 적어도 하나 이상을 출력하는 것이며, 상기 채팅 데이터 서비스 장치가, 상기 사용자 발화 데이터가 종속적 연결어미로 연결된 중문이면 상기 종속적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들과 단문들 사이의 상호정보량을 상기 상호정보량 데이터베이스에서 검출하고, 상호정보량이 가장 큰 시스템 응답 데이터를 선택하여 출력하고, 상기 사용자 발화 데이터가 대등적 연결어미로 연결된 중문이면, 상기 대등적 연결어미를 기준으로 하여 사용자 발화 데이터를 단문들로 분할하고, 각 분할된 단문들의 문장정보를 추출하고, 그 문장정보들에 대응되는 시스템 응답 데이터들을 상기 색인 데이터베이스에 저장된 색인정보에서 검출하고, 그 시스템 응답 데이터들을 출력함을 특징으로 하는 채팅 데이터 서비스 시스템
|
16 |
16
삭제
|