1 |
1
영상 데이터, 대화 데이터 및 대상 질의를 수신하는 입력부; 및상기 대화 데이터 및 상기 대상 질의에 대해 주제 처리 결과를 획득하고, 상기 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 융합하여 제1 융합 데이터를 획득하고, 상기 대화 데이터 및 상기 대상 질의에 대한 맥락 처리 결과를 획득하고, 상기 맥락 처리 결과 및 상기 제1 융합 데이터를 조합하여 제2 융합 데이터를 획득하고, 상기 제2 융합 데이터로부터 상기 대상 질의에 대한 응답을 획득하는 프로세서;를 포함하는 대화 처리 장치
|
2 |
2
제1항에 있어서,상기 프로세서는, 상기 대화 데이터 및 상기 질의에 대한 임베딩을 각각 획득하고, 상기 임베딩 각각에 대응하는 인코딩 결과를 각각 획득하고, 각각의 임코딩 결과를 기반으로 제1 가중치를 획득하고, 상기 제1 가중치를 상기 대화 데이터에 대한 임베딩에 부가하여 상기 주제 처리 결과를 획득하는 대화 처리 장치
|
3 |
3
제2항에 있어서,상기 프로세서는, 상기 제1 가중치가 부가된 대화 데이터에 대한 임베딩에, 상기 맥락 처리 결과의 획득 과정에서 연산된 제2 가중치를 더 부가하여 어텐션 처리된 표현을 획득하고, 상기 어텐션 처리된 표현을 기반으로 상기 주제 처리 결과를 획득하는 대화 처리 장치
|
4 |
4
제3항에 있어서,상기 제2 가중치는 상기 대화 데이터 및 상기 대상 질의에 대한 맥락 처리 결과를 연산하는 과정에서 획득된 것인 대화 처리 장치
|
5 |
5
제1항에 있어서,상기 프로세서는, 상기 대화 데이터 및 상기 질의에 대한 임베딩을 각각 획득하고, 상기 임베딩 각각에 대응하는 인코딩 결과를 각각 획득하고, 각각의 임코딩 결과를 기반으로 제2 가중치를 획득하고, 상기 제2 가중치를 상기 대화 데이터에 대응하는 인코딩 결과에 부가하고, 상기 제2 가중치가 부가된 인코딩 결과에 상기 질의에 대응하는 인코딩 결과를 기반으로 상기 맥락 처리 결과를 획득하는 대화 처리 장치
|
6 |
6
제1항에 있어서,상기 프로세서는, 상기 영상 데이터로부터 획득한 특성 및 상기 주제 처리 결과를 기반으로 제3 가중치를 획득하고, 상기 제3 가중치를 상기 주제 처리 결과에 부가하고, 상기 제3 가중치가 부가된 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 병합하여 상기 제1 융합 데이터를 획득하는 대화 처리 장치
|
7 |
7
제1항에 있어서,상기 프로세서는, 상기 제1 융합 데이터 및 상기 맥락 처리 결과를 병합하여 병합 결과를 획득하고, 상기 병합 결과를 기반으로 제4 가중치를 획득하고, 상기 제4 가중치를 상기 병합 결과에 부가하여 상기 제2 융합 데이터를 획득하는 대화 처리 장치
|
8 |
8
제1항에 있어서,상기 프로세서는, 상기 제2 융합 데이터를 학습 모델에 적용하여 학습 결과를 획득하는 대화 처리 장치
|
9 |
9
제8항에 있어서,상기 프로세서는, 상기 학습 결과를 디코딩하여 상기 질의에 대응하는 응답을 획득하는 대화 처리 장치
|
10 |
10
제9항에 있어서,상기 프로세서는, 적어도 하나의 응답 후보 중에서 적어도 하나를 검출함으로써 상기 질의에 대응하는 응답을 획득하는 대화 처리 장치
|
11 |
11
영상 데이터, 대화 데이터 및 대상 질의를 수신하는 단계;상기 대화 데이터 및 상기 대상 질의에 대해 주제 처리 결과를 획득하는 단계;상기 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 융합하여 제1 융합 데이터를 획득하는 단계;상기 대화 데이터 및 상기 대상 질의에 대한 맥락 처리 결과를 획득하는 단계;상기 맥락 처리 결과 및 상기 제1 융합 데이터를 조합하여 제2 융합 데이터를 획득하는 단계; 및상기 제2 융합 데이터로부터 상기 대상 질의에 대한 응답을 획득하는 단계;를 포함하는 대화 처리 방법
|
12 |
12
제11항에 있어서,상기 대화 데이터 및 상기 대상 질의에 대해 주제 처리 결과를 획득하는 단계는, 상기 대화 데이터 및 상기 질의에 대한 임베딩을 각각 획득하는 단계;상기 임베딩 각각에 대응하는 인코딩 결과를 각각 획득하는 단계;각각의 임코딩 결과를 기반으로 제1 가중치를 획득하는 단계; 및상기 제1 가중치를 상기 대화 데이터에 대한 임베딩에 부가하여 상기 주제 처리 결과를 획득하는 단계;를 포함하는 대화 처리 방법
|
13 |
13
제12항에 있어서,상기 대화 데이터 및 상기 대상 질의에 대해 주제 처리 결과를 획득하는 단계는, 상기 제1 가중치가 부가된 대화 데이터에 대한 임베딩에, 상기 맥락 처리 결과의 획득 과정에서 연산된 제2 가중치를 더 부가하여 어텐션 처리된 표현을 획득하는 단계; 및상기 어텐션 처리된 표현을 기반으로 상기 주제 처리 결과를 획득하는 단계;를 더 포함하는 대화 처리 방법
|
14 |
14
제11항에 있어서,상기 대화 데이터 및 상기 대상 질의에 대한 맥락 처리 결과를 획득하는 단계는,상기 대화 데이터 및 상기 질의에 대한 임베딩을 각각 획득하는 단계;상기 임베딩 각각에 대응하는 인코딩 결과를 각각 획득하는 단계;각각의 임코딩 결과를 기반으로 제2 가중치를 획득하는 단계;상기 제2 가중치를 상기 대화 데이터에 대응하는 인코딩 결과에 부가하는 단계; 및상기 제2 가중치가 부가된 인코딩 결과에 상기 질의에 대응하는 인코딩 결과를 기반으로 상기 맥락 처리 결과를 획득하는 단계;를 포함하는 대화 처리 방법
|
15 |
15
제11항에 있어서,상기 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 융합하여 제1 융합 데이터를 획득하는 단계는,상기 영상 데이터로부터 획득한 특성 및 상기 주제 처리 결과를 기반으로 제3 가중치를 획득하는 단계;상기 제3 가중치를 상기 주제 처리 결과에 부가하는 단계; 및상기 제3 가중치가 부가된 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 병합하여 상기 제1 융합 데이터를 획득하는 단계;를 포함하는 대화 처리 방법
|
16 |
16
제11항에 있어서,상기 제2 융합 데이터로부터 상기 대상 질의에 대한 응답을 획득하는 단계는,상기 제1 융합 데이터 및 상기 맥락 처리 결과를 병합하여 병합 결과를 획득하는 단계; 및상기 병합 결과를 기반으로 제4 가중치를 획득하고, 상기 제4 가중치를 상기 병합 결과에 부가하여 상기 제2 융합 데이터를 획득하는 단계;를 포함하는 대화 처리 방법
|
17 |
17
제11항에 있어서,상기 제2 융합 데이터를 학습 모델에 적용하여 학습 결과를 획득하는 단계;를 더 포함하는 대화 처리 방법
|
18 |
18
제17항에 있어서,상기 학습 결과를 디코딩하여 상기 질의에 대응하는 응답을 획득하는 단계;를 더 포함하는 대화 처리 방법
|
19 |
19
적어도 하나의 단말 장치; 및상기 적어도 하나의 단말 장치와 통신 가능한 적어도 하나의 서버 장치;를 포함하되,상기 적어도 하나의 단말 장치 및 상기 적어도 하나의 서버 장치 중 적어도 하나는, 영상 데이터, 대화 데이터 및 대상 질의를 수신하고, 상기 대화 데이터 및 상기 대상 질의에 대해 주제 처리 결과를 획득하고, 상기 주제 처리 결과 및 상기 영상 데이터로부터 획득한 특성을 융합하여 제1 융합 데이터를 획득하고, 상기 대화 데이터 및 상기 대상 질의에 대한 맥락 처리 결과를 획득하고, 상기 맥락 처리 결과 및 상기 제1 융합 데이터를 조합하여 제2 융합 데이터를 획득하고, 상기 제2 융합 데이터로부터 상기 대상 질의에 대한 응답을 획득하는 대화 처리 시스템
|