1 |
1
사용자로부터 음성 신호를 입력받는 발화 음성 입력부;상기 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화를 전달하는 이전 문장 입력부; 상기 발화 음성 입력부를 통해 음성 신호만을 디코딩하여 백터를 전달하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 상기 이전 문장 입력부를 통해 전달되는 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 상기 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 상기 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부;를 포함하는 문맥 기반 자동 통역 성능 향상 장치
|
2 |
2
제1항에 있어서, 상기 통역 디코딩 처리부는, 상기 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하지 않는 것으로 판단되면, 상기 음성 인코딩 처리부를 통해 디코딩된 음성 신호만을 이용하여 디코딩을 수행하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
3 |
3
제1항에 있어서, 상기 다국어 임베딩 언어 모델은, 임베딩 언어 모델을 학습하기에 충분한 양의 통역 대상 언어 다국어 텍스트를 수집하는 학습정보 수집부; 상기 수집된 텍스트에서 적합하지 않은 기호를 삭제하거나 특정 텍스트로 변환하는 전처리부; 상기 전처리된 텍스트를 기설정된 형태로 토큰화하는 토크나이징 처리부; 다국어 텍스트에 대응되도록 상기 토큰화된 텍스트를 임베딩을 수행하는 임베딩 처리부; 및 상기 임베딩된 다국어 텍스트를 학습하는 다국어 임베딩 언어 모델 학습부를 포함하는 문맥 기반 자동 통역 성능 향상 장치
|
4 |
4
제3항에 있어서, 상기 토큰화는, 기설정된 길이의 음절, 단어, 어절 또는 BPE(Byte Pair Encoding) 토큰 중 하나의 형태로 토큰화하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
5 |
5
제3항에 있어서, 상기 임베딩 처리부는, 토큰 임베딩(Token Embedding), 세그먼트 임베딩(Segment Embedding), 포지션 임베딩(Position Embedding) 중 하나 또는 복수의 방법을 동시에 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
6 |
6
제3항에 있어서, 상기 다국어 임베딩 언어 모델 학습부는, 마스킹 언어 모델(Masked Language Model), 다음 문장 예측(Next Sentence Prediction) 등의 기법과 어텐션 등을 이용해 언어 모델 인코더를 학습하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
7 |
7
제1항에 있어서, 상기 다국어 임베딩 언어모델은, 통역 대상 언어의 위치가 서로 유사한 공간에 위치되도록 차원 공간을 변환하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
8 |
8
제1항에 있어서, 상기 다국어 임베딩 언어모델은, 기존에 학습되어져 있는 다국어 임베딩 언어모델을 기반으로 아키텍쳐를 새로운 목적에 맞게 변형한 후 학습된 모델 가중치(Weights)를 이용하여 학습 결과를 업데이트하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
|
9 |
9
통역 대상 언어인 다국어 텍스트를 수집하는 단계; 상기 수집된 텍스트를 전처리하는 단계; 상기 전처리된 텍스트를 토큰화하는 단계; 다국어 텍스트인 상기 토큰화된 텍스트를 임베딩하는 단계; 및 문맥 예측 모델과 어텐션 언어모델을 이용하여 학습하는 단계를 포함하는 문맥 기반 자동 통역 성능 학습 방법
|
10 |
10
제9항에 있어서, 상기 문맥 예측 모델은, 마스킹 언어 모델(Masked Language Model), 다음 문장 예측(Next Sentence Prediction) 모델 중 하나인 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
|
11 |
11
제9항에 있어서, 상기 임베딩하는 단계는, 토큰 임베딩(Token Embedding), 세그먼트 임베딩(Segment Embedding), 포지션 임베딩(Position Embedding) 중 하나 또는 복수의 방법을 동시에 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
|
12 |
12
제9항에 있어서, 상기 토큰화하는 단계는, 기설정된 길이의 음절, 단어, 어절 또는 BPE(Byte Pair Encoding) 토큰의 형태 중 하나의 형태로 토큰화하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
|
13 |
13
제9항에 있어서, 상기 문맥 예측 모델은, 통역 대상 언어의 위치를 서로 유사한 공간에 변환하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
|
14 |
14
제9항에 있어서, 상기 문맥 예측 모델은, 통역 대상 도메인이 특수한, 또는 제한된 도메인인 경우 일반적인 텍스트로 구성된 기본 다국어 임베딩 모델을 해당 도메인 텍스트 기반 파인 튜닝을 수행한 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
|
15 |
15
사용자로부터 음성 신호를 입력받는 단계; 이전 발화가 존재하는지를 판단하는 단계; 상기 판단 단계에서 이전 발화가 존재하면, 문맥 인코더에 의해, 상기 이용하여 이전 발화에서 문맥 벡터를 추출하는 단계; 음성 인코더에 의해, 사용자의 음성 입력이 끝나면 사용자의 음성을 인코딩하는 단계; 통역 디코더에 의해, 문맥 인코더에 의해 추출된 문맥 벡터와 상기 음성 인코더에 의해 추출된 음성 벡터를 이용하여 통역을 수행하는 단계;를 포함하는 문맥 기반 자동 통역 성능 향상 방법
|
16 |
16
제15항에 있어서, 상기 판단 단계에서 상기 이전 발화가 존재하지 않으면, 통역 디코더에 의해, 상기 음성 인코더로부터 인코딩된 사용자의 음성 신호만을 이용하여 디코딩을 수행하는 단계를 포함하는 문맥 기반 자동 통역 성능 향상 방법
|
17 |
17
제15항에 있어서, 상기 문맥 벡터를 추출하는 단계는, 다국어 임베딩 언어 모델을 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 방법
|