1 |
1
적어도 하나의 프로세서에 의해 동작하는 대화 모델 생성 시스템이 다중 도메인 대화 모델을 생성하는 방법으로서,첫 번째 도메인에서부터 n-1번째 도메인까지 학습이 순차적으로 완료된 단일 도메인 대화 모델을, n번째 도메인에 해당하는 복수의 학습 데이터들과, 상기 첫 번째 도메인에서부터 상기 n-1번째 도메인까지 추출한 복수의 복습 데이터들로 단일 도메인 대화 모델을 학습시키는 단계, 그리고상기 학습 데이터들을 클러스터링하여, 상기 n번째 도메인에 대한 복수의 복습 데이터들을 추출하는 단계를 포함하는, 다중 도메인 대화 모델 생성 방법
|
2 |
2
제1항에 있어서,상기 단일 도메인 대화 모델을 학습시키는 단계는,상기 n번째 도메인의 복수의 학습 데이터들과 상기 복수의 복습 데이터들에서 미리 설정한 비율로 데이터들을 선택하여 상기 단일 도메인 대화 모델을 학습시키는, 다중 도메인 대화 모델 생성 방법
|
3 |
3
제2항에 있어서,상기 복수의 복습 데이터들을 추출하는 단계는, 상기 학습 데이터들을 클러스터링하여 앵커를 계산하는 단계,상기 학습 데이터들을 상기 앵커 근처의 중심 데이터들과 상기 앵커에서 떨어진 경계 데이터들로 구분하는 단계, 그리고상기 경계 데이터들을 상기 n번째 도메인의 복습 데이터들로 선택하는 단계를 포함하는, 다중 도메인 대화 모델 생성 방법
|
4 |
4
제3항에 있어서,상기 복수의 복습 데이터들을 추출하는 단계 이후에,상기 단일 도메인 대화 모델이 상기 n번째 도메인의 학습 데이터들에 의해 학습이 종료되었는지 확인하는 단계, 그리고학습이 종료되었다면, n+1번째 도메인의 학습 데이터들과 상기 첫 번째 도메인에서부터 상기 n번째 도메인까지의 복습 데이터들을 이용하여, 상기 단일 도메인 대화 모델을 학습시키는 단계를 포함하는, 다중 도메인 대화 모델 생성 방법
|
5 |
5
제4항에 있어서,상기 학습이 종료되었는지 확인하는 단계는,상기 n번째 도메인의 모든 학습 데이터들로 상기 단일 도메인 대화 모델을 학습시키면 학습이 종료되었다고 판단하는, 다중 도메인 대화 모델 생성 방법
|
6 |
6
제4항에 있어서,상기 학습이 종료되었는지 확인하는 단계는,상기 n번째 도메인의 학습 데이터에 포함된 복수의 질의들에 대한 정답 데이터들과, 해당 질의가 입력되면 상기 단일 도메인 대화 모델이 생성한 답변이 얼마나 매칭되는지 나타내는 BLEU 수치가 미리 설정된 임계 수치 이상이면, 학습이 종료되었다고 판단하는, 다중 도메인 대화 모델 생성 방법
|
7 |
7
단일 도메인 대화 모델로부터 다중 도메인 대화 모델을 생성하는 다중 도메인 대화 모델 생성 시스템으로서,첫 번째 도메인에서부터 n-1번째 도메인까지 학습이 순차적으로 완료된 단일 도메인 대화 모델을, n번째 도메인의 복수의 학습 데이터들과 상기 첫 번째 도메인에서부터 상기 n-1번째 도메인까지의 복습 데이터들로 학습시켜, 다중 도메인 대화 모델로 생성하는 대화 모델 학습부, 그리고상기 n번째 도메인의 복수의 학습 데이터들을 클러스터링하고, 상기 n번째 도메인의 복습 데이터들을 추출하는 데이터 샘플링부를 포함하는, 다중 도메인 대화 모델 생성 시스템
|
8 |
8
제7항에 있어서,상기 대화 모델 학습부는,상기 n번째 도메인의 복수의 학습 데이터들과 상기 복수의 복습 데이터들에서 미리 설정한 비율로 데이터들을 선택하여 상기 단일 도메인 대화 모델을 학습시키는, 다중 도메인 대화 모델 생성 시스템
|
9 |
9
제8항에 있어서,상기 대화 모델 학습부는,상기 n번째 도메인의 학습 데이터들에 의해 상기 단일 도메인 대화 모듈의 학습이 종료되면, n+1번째 도메인의 학습 데이터들과 상기 첫 번째 도메인에서부터 상기 n번째 도메인까지의 복습 데이터들을 이용하여 상기 학습된 단일 도메인 대화 모델을 학습시키는, 다중 도메인 대화 모델 생성 시스템
|
10 |
10
제9항에 있어서,상기 데이터 샘플링부는,상기 n번째 도메인의 학습 데이터들을 클러스터링하여 앵커를 계산하고, 상기 앵커에서 떨어져 분포된 경계 데이터들을 상기 n번째 도메인의 복습 데이터들로 선택하는, 다중 도메인 대화 모델 생성 시스템
|