1 |
1
입력 문장의 전처리를 위하여, 텍스트 군집인 말뭉치로부터 문법적으로 더 이상 나눌 수 없는 언어요소로 분리하기 위한 토큰화 모듈, 토큰 군집 중 어떤 특징이 유용한지 확인하여 추출하는 특징 추출 모듈, 및 인공신경망 챗봇이 학습하기 위한 학습 데이터를 포함하는 전처리 기능 수행부; 및화자의 질의 문장에 대한 의도 분류와 의도 분류 후 문장 내 개체를 추출하기 위한 의도 분류 및 개체 추출 모듈, 추출된 개체를 슬롯(Slot)에 알맞게 매핑하기 위한 개체 매핑 모듈, 및 질의응답 대화 시나리오의 정책을 설정하기 위한 대화 정책 모듈을 포함하는 의도 분류 및 개체 추출 수행부;를 포함하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
2 |
2
제 1항에 있어서, 상기 토큰화 모듈은, 상기 학습 데이터의 텍스트 군집인 말뭉치로부터 한국어의 어간과 어미 분석, 및 명사 추출에 최적화된 토큰화를 수행하며,상기 특징 추출 모듈은, 상기 토큰화 모듈을 통해 추출된 토큰 중 유용한 특징으로 여겨지는 토큰을 선정하며, 상기 학습 데이터는, 산업분야에서 활용하는 공통 업무대상 데이터 셋을 포함하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
3 |
3
제 1항에 있어서, 상기 의도 분류 및 개체 추출 모듈은, 질의 문장의 의도가 지정된 복수의 슬롯 중 어느 슬롯에 해당하는지 분류하고,상기 개체 매핑 모듈은, 상기 의도 분류 및 개체 추출 모듈을 통해 추출된 각 개체를 지정된 복수의 슬롯 중 해당하는 슬롯에 매핑하며,상기 대화 정책 모듈은, 지정된 알고리즘에 따라 질의응답 대화 시나리오의 정책을 설정하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
4 |
4
제 1항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,개체 손실과 의도 손실, 및 마스크 손실 값을 더하면서 손실의 총 합을 계산하며, 상기 총 합을 계산하는 과정을 반복 수행하여, 이 손실 합계를 최소화하기 위해 학습을 수행하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
5 |
5
제 4항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,토큰화 모듈을 통해 추출된 토큰 집합을 복수의 순방향 계층을 통해 트랜스포머 계층으로 입력하고, 상기 트랜스포머 계층으로부터 출력된 토큰 집합은 개체 집합과 함께 조건부 랜덤 필드 알고리즘에 입력하고, 상기 조건부 랜덤 필드 알고리즘을 통해 미리 지정된 최적값을 찾는 파라미터를 활용하여 개체 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
6 |
6
제 5항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,상기 트랜스포머 계층에서 상기 토큰화 모듈을 통해 추출된 토큰 집합의 문장 인코딩을 지칭하는 클래스 토큰을 출력하여 임베딩 계층으로 입력하고, 그리고 상기 클래스 토큰과 의도 집합으로부터 다른 임베딩 계층을 거쳐 각기 출력된 값을 이용해서 지정된 유사도 계산식을 통해 유사도를 최대화하는 내적 손실 및 유사도를 최소화하는 내적 손실을 산출하고, 상기 산출된 값을 이용하여 의도 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
7 |
7
제 5항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,상기 토큰 집합에 포함된 마스크(Mask) 토큰을 순방향 계층을 거쳐 트랜스포머 계층을 통해 출력하여 임베딩 계층으로 입력하고,상기 토큰 집합에서 랜덤으로 선택된 토큰에 대한 트랜스포머 계층의 출력을 지정된 유사도 계산식을 통해 유사도를 최대화하는 내적 손실 및 유사도를 최소화하는 내적 손실을 산출하고, 상기 산출된 값을 이용하여 마스크 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치
|
8 |
8
인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화를 위하여, 문장이 입력되면 전처리 기능 수행부가, 입력된 문장의 전처리를 위하여, 입력됨 문장을 토큰화 모듈을 통해 텍스트 군집인 말뭉치로부터 문법적으로 더 이상 나눌 수 없는 언어요소로 분리하고, 특징 추출 모듈을 통해 토큰 군집 중 어떤 특징이 유용한지 확인하여 추출하는 단계; 및 의도 분류 및 개체 추출 수행부가, 의도 분류 및 개체 추출 모듈을 통해 화자의 질의 문장에 대한 의도 분류 및 의도 분류 후 문장 내 개체를 추출을 수행하며, 개체 매핑 모듈을 통해 상기 추출된 개체를 해당 개체에 지정된 슬롯(Slot)에 맞춰 매핑하는 단계;를 포함하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
9 |
9
제 8항에 있어서, 상기 토큰화 모듈은, 상기 학습 데이터의 텍스트 군집인 말뭉치로부터 한국어의 어간과 어미 분석, 및 명사 추출에 최적화된 토큰화를 수행하며,상기 특징 추출 모듈은, 상기 토큰화 모듈을 통해 추출된 토큰 중 유용한 특징으로 여겨지는 토큰을 선정하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
10 |
10
제 8항에 있어서, 상기 의도 분류 및 개체 추출 모듈은, 질의 문장의 의도가 지정된 복수의 슬롯 중 어느 슬롯에 해당하는지 분류하고,상기 개체 매핑 모듈은, 상기 의도 분류 및 개체 추출 모듈을 통해 추출된 각 개체를 지정된 복수의 슬롯 중 해당하는 슬롯에 매핑하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
11 |
11
제 8항에 있어서, 상기 화자의 질의 문장에 대한 의도 분류와 의도 분류 후 문장 내 개체를 추출하기 위하여,상기 의도 분류 및 개체 추출 모듈은,개체 손실과 의도 손실, 및 마스크 손실 값을 더하면서 손실의 총 합을 계산하며, 상기 총 합을 계산하는 과정을 반복 수행하여, 이 손실 합계를 최소화하기 위해 학습을 수행하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
12 |
12
제 11항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,토큰화 모듈을 통해 추출된 토큰 집합을 복수의 순방향 계층을 통해 트랜스포머 계층으로 입력하고, 상기 트랜스포머 계층으로부터 출력된 토큰 집합은 개체 집합과 함께 조건부 랜덤 필드 알고리즘에 입력하고, 상기 조건부 랜덤 필드 알고리즘을 통해 미리 지정된 최적값을 찾는 파라미터를 활용하여 개체 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
13 |
13
제 12항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,상기 트랜스포머 계층에서 상기 토큰화 모듈을 통해 추출된 토큰 집합의 문장 인코딩을 지칭하는 클래스 토큰을 출력하여 임베딩 계층으로 입력하고, 그리고 상기 클래스 토큰과 의도 집합으로부터 다른 임베딩 계층을 거쳐 각기 출력된 값을 이용해서 지정된 유사도 계산식을 통해 유사도를 최대화하는 내적 손실 및 유사도를 최소화하는 내적 손실을 산출하고, 상기 산출된 값을 이용하여 의도 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|
14 |
14
제 12항에 있어서, 상기 의도 분류 및 개체 추출 모듈은,상기 토큰 집합에 포함된 마스크(Mask) 토큰을 순방향 계층을 거쳐 트랜스포머 계층을 통해 출력하여 임베딩 계층으로 입력하고,상기 토큰 집합에서 랜덤으로 선택된 토큰에 대한 트랜스포머 계층의 출력을 지정된 유사도 계산식을 통해 유사도를 최대화하는 내적 손실 및 유사도를 최소화하는 내적 손실을 산출하고, 상기 산출된 값을 이용하여 마스크 손실을 계산하는 것을 특징으로 하는 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 방법
|