1 |
1
기계 학습 기반 고객 서비스 어시스턴트 보조 시스템의 서버; 고객의 자주 묻는 질문(FAQ)의 질문-응답 쌍이 저장된 데이터베이스; 및 고객 질문이 입력되면 상기 서버로 전달되며, 머신러닝 모듈이 상기 데이터베이스를 검색하여 상기 고객 질문을 미리 정의된 FAQ 목록의 질문과 비교하며, 상기 고객 질문의 한글 문장을 각 문자에 대하여 음소 단위로 분해하고 각 음소를 벡터로 embedding하며, 머신 러닝 모델을 사용하여 고객 질문과 FAQ 질문의 두 문장의 문장 유사도 모델(sentence similarity model) 학습 알고리즘을 사용하여 두 문장의 유사도(similarity)를 학습하여 문장 유사도가 높은 상위 k개의 FAQ를 객관식으로 상담원에게 제시되고 FAQ 중 하나가 선택되면 자동으로 학습데이터로 변환하여 해당 질문에 답변을 출력하도록 하는 문장 유사도 모델 머신러닝 시스템; 을 포함하는 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
2 |
2
제1항에 있어서, 상기 머신 러닝 모델은 머신 러닝의 문장 유사도 측정(sentence similarity measure)을 위한 BiGRU(bidirectional gated recurrent unit) 머신 러닝의 기계 학습 엔진과 문장 유사도 모델(sentence similarity model) 학습 알고리즘을 사용하는, 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
3 |
3
제2항에 있어서, 상기 고객 서비스 어시스턴트 보조 시스템으로 질문이 입력되면, 질문은 문장/탭으로 분리된 단어에 각 문자에 대하여 초성 자음, 모음, 그리고 종성 자음들로 분해되고, 분해된 요소들은 표 1에 주어진 해당 토큰들에 의해 교체되고, 하나의 질문은 일련의 토큰들(sequence of tokens)로 변환되며, 시퀀스의 길이는 150으로 고정되며, 150보다 길면 초과된 부분이 절단되고, 시퀀스가 150보다 짧은 나머지 섹션은 0으로 채워져 토큰화되는, 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
4 |
4
제3항에 있어서, 상기 문장 유사도 모델(Sentence similarity model)은 고객 질문의 토큰화 전처리 후, 각각의 토큰 시퀀스(each sequence of tokens)는 각 임베딩 레이어(Embedding layer)를 통해 임의의 벡터(random vector)로 임베디드 되며, 실시예에서는 임베딩 크기(embedding size)를 256으로 설정했으며, 임의의 벡터는 문장 유사도 측정(sentence similarity measure)에 사용되는 BiGRU(bidirectional gated recurrent unit) 머신 러닝으로 계산되며, 고객 질문의 문장과 데이터베이스에서 선택된 FAQ의 질문-응답쌍의 문장, 두 문장의 유사도(similarity)는 완전 연결층(full connect layer)과 유클리드 거리(euclidian distance)를 사용한 sigmoid 함수로 계산되고, 두 문장(sentence1, sentence2)의 유사도(similarity)는 0과 1 사이의 값이 되며, 값이 1에 가까울수록 두 문장이 유사하고, 고객 질문(질의)와 학습 데이터와의 거리를 측정하기 위해 유클리드 거리 d(X,Y)를 사용하며, N차원 공간의 두 점 X = (x1,x2,x3,
|
5 |
5
제1항에 있어서, 상기 문장 유사도 모델 머신러닝 시스템은 1) 고객 질문의 한글 문장을 각 문자에 대하여 음소 단위로 분해하고, 2) 각 음소를 벡터로 embedding하며(embedding size 256으로 설정), 3) BiGRU(bidirectional gated recurrent unit) 머신 러닝을 이용해 두 문장의 유사도를 학습하며, 4) 상담원의 고객 응대에 활용하는데 있어서, 고객 질문-응답 쌍이 준비되며,5) 고객 질문은 서버의 데이터베이스에 기 저장된 FAQ들 중에 하나의 형태로 각각 비교하고, 6) 상기 고객 질문과 선택된 하나의 FAQ의 질문 유사도를 비교하여 두 문장의 유사도가 가장 높은 top 5개의 FAQ를 상담원에게 객관식으로 제시하며7) 상담원은 이 중 실제 고객의 질문에 대한 답이 존재하면, 5개의 FAQ 중 하나를 선택하며, 8) 실제 고객의 질문에 대한 답이 존재하지 않으면, '존재하지 않음' 항목을 선택되며, 9) 상담원이 항목을 선택하면, 이는 즉시 새로운 학습데이터로 자동 변환하여 데이터베이스에 저장하며, 10) 이후 주기적으로 새롭게 모인 학습데이터로 모델을 재학습해 데이터베이스에 업데이트하는, 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
6 |
6
제1항에 있어서, 고객 질문은 고객 커뮤니티에서 웹 크롤링을 통해 인위적으로 질문 데이터를 수집하여 서버의 데이터베이스에 저장되었으며, 배치 크기(batch size)는 128이고, 임베딩 크기(embedding size)는 256으로 실험을 수행했으며, 실행 속도는 0
|
7 |
7
제1항에 있어서, 상기 고객 서비스 어시스턴트 보조 시스템은 입력된 고객 질문에 대하여 서비스 직원에게 k개의 질문-응답 쌍을 갖는 권장사항 FAQ들(recommended FAQs)을 표시하며, 고객 질문에 대하여 서버 데이터베이스에 저장된 고객 서비스 직원이 선택한 FAQ가 있는 데이터는 '1'로 표시되고, FAQ에 질문이 없는 데이터는 '0'으로 표시되며, 서비스 직원이 권장 사항 FAQ들 중에서 하나의 FAQ를 선택하며, 해당하는 고객 질문에 대한 응답이 출력되는, 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
8 |
8
제7항에 있어서, 상기 고객 서비스 어시스턴트 보조 시스템은 고객 질문에 대하여 문장 유사도가 높은 상위 5개의 FAQ를 객관식으로 서비스 직원에게 제시되고, 상기 서비스 직원이 권장 사항 FAQ들 중에서 하나의 FAQ를 선택하며, 해당하는 고객 질문에 대한 응답이 출력되는, 머신 러닝 기반 한국 고객 서비스 어시스턴트 보조 시스템
|
9 |
9
제7항에 있어서, 고객 서비스 직원이 선택한 FAQ에 없는 고객 질문 데이터는 '0'으로 표시되며, 새로운 고객 질문 데이터는 학습 모델(learning model)을 질문-응답 쌍을 다시 구성하여 재학습(re-training)하는데 사용되며, 재학습은 두 가지 방법으로 수행되며, 첫 번째 방법은 기본 모델(baseline model)의 가중치들(weights)을 유지하고 새로운 데이터로 훈련을 다시 시작하는 것이다
|