맞춤기술찾기

이전대상기술

문맥 기반 자동 통역 성능 향상 장치 및 방법

  • 기술번호 : KST2023001578
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 문맥 기반 자동 통역 성능 향상 장치에 관한 것이다. 본 발명은 사용자로부터 음성 신호를 입력받는 발화 음성 입력부; 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화가 존재하는지를 판단하는 이전 문장 입력부; 사용자의 이전 발화가 존재하지 않으면 발화 음성 입력부를 통해 음성 신호만을 디코딩하고, 사용자의 이전 발화가 존재하면 음성 신호의 벡터를 추출하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부를 포함한다.
Int. CL G06F 40/58 (2020.01.01) G06F 40/289 (2020.01.01) G06F 40/284 (2020.01.01) G10L 15/04 (2006.01.01) G10L 15/183 (2013.01.01) G10L 19/00 (2006.01.01) G10L 15/00 (2006.01.01) G10L 15/26 (2006.01.01) G10L 15/06 (2006.01.01) G06N 20/00 (2019.01.01)
CPC G06F 40/58(2013.01) G06F 40/289(2013.01) G06F 40/284(2013.01) G10L 15/04(2013.01) G10L 15/183(2013.01) G10L 19/0018(2013.01) G10L 15/005(2013.01) G10L 15/26(2013.01) G10L 15/063(2013.01) G06N 20/00(2013.01)
출원번호/일자 1020220002266 (2022.01.06)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2023-0106414 (2023.07.13) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.09.07)
심사청구항수 17

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 윤승 대전광역시 유성구
2 방정욱 대전광역시 유성구
3 이민규 대전광역시 유성구
4 김상훈 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.01.06 수리 (Accepted) 1-1-2022-0019873-17
2 [심사청구]심사청구서·우선심사신청서
2022.09.07 수리 (Accepted) 1-1-2022-0940804-36
3 선행기술조사의뢰서
Request for Prior Art Search
2023.02.15 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
사용자로부터 음성 신호를 입력받는 발화 음성 입력부;상기 발화 음성 입력부에 의해 음성 신호가 입력되면, 사용자의 이전 발화를 전달하는 이전 문장 입력부; 상기 발화 음성 입력부를 통해 음성 신호만을 디코딩하여 백터를 전달하는 음성 인코딩 처리부; 이전 발화가 존재하는 경우, 상기 이전 문장 입력부를 통해 전달되는 이전 발화에서 문맥 벡터를 추출하고, 추출된 이전 발화의 문맥 벡터를 전달하는 문맥 인코딩 처리부; 및 다국어 임베딩 언어 모델을 기반으로, 상기 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하는 것으로 판단되면, 추출된 상기 음성 신호의 벡터 어텐션 정보와 상기 추출된 이전 발화의 문맥 벡터의 어텐션 정보를 이용하여 통역에 대한 디코딩을 수행하여 통역 결과 텍스트를 출력하는 통역 디코딩 처리부;를 포함하는 문맥 기반 자동 통역 성능 향상 장치
2 2
제1항에 있어서, 상기 통역 디코딩 처리부는, 상기 이전 문장 입력부에 의해 사용자의 이전 발화가 존재하지 않는 것으로 판단되면, 상기 음성 인코딩 처리부를 통해 디코딩된 음성 신호만을 이용하여 디코딩을 수행하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
3 3
제1항에 있어서, 상기 다국어 임베딩 언어 모델은, 임베딩 언어 모델을 학습하기에 충분한 양의 통역 대상 언어 다국어 텍스트를 수집하는 학습정보 수집부; 상기 수집된 텍스트에서 적합하지 않은 기호를 삭제하거나 특정 텍스트로 변환하는 전처리부; 상기 전처리된 텍스트를 기설정된 형태로 토큰화하는 토크나이징 처리부; 다국어 텍스트에 대응되도록 상기 토큰화된 텍스트를 임베딩을 수행하는 임베딩 처리부; 및 상기 임베딩된 다국어 텍스트를 학습하는 다국어 임베딩 언어 모델 학습부를 포함하는 문맥 기반 자동 통역 성능 향상 장치
4 4
제3항에 있어서, 상기 토큰화는, 기설정된 길이의 음절, 단어, 어절 또는 BPE(Byte Pair Encoding) 토큰 중 하나의 형태로 토큰화하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
5 5
제3항에 있어서, 상기 임베딩 처리부는, 토큰 임베딩(Token Embedding), 세그먼트 임베딩(Segment Embedding), 포지션 임베딩(Position Embedding) 중 하나 또는 복수의 방법을 동시에 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
6 6
제3항에 있어서, 상기 다국어 임베딩 언어 모델 학습부는, 마스킹 언어 모델(Masked Language Model), 다음 문장 예측(Next Sentence Prediction) 등의 기법과 어텐션 등을 이용해 언어 모델 인코더를 학습하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
7 7
제1항에 있어서, 상기 다국어 임베딩 언어모델은, 통역 대상 언어의 위치가 서로 유사한 공간에 위치되도록 차원 공간을 변환하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
8 8
제1항에 있어서, 상기 다국어 임베딩 언어모델은, 기존에 학습되어져 있는 다국어 임베딩 언어모델을 기반으로 아키텍쳐를 새로운 목적에 맞게 변형한 후 학습된 모델 가중치(Weights)를 이용하여 학습 결과를 업데이트하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 장치
9 9
통역 대상 언어인 다국어 텍스트를 수집하는 단계; 상기 수집된 텍스트를 전처리하는 단계; 상기 전처리된 텍스트를 토큰화하는 단계; 다국어 텍스트인 상기 토큰화된 텍스트를 임베딩하는 단계; 및 문맥 예측 모델과 어텐션 언어모델을 이용하여 학습하는 단계를 포함하는 문맥 기반 자동 통역 성능 학습 방법
10 10
제9항에 있어서, 상기 문맥 예측 모델은, 마스킹 언어 모델(Masked Language Model), 다음 문장 예측(Next Sentence Prediction) 모델 중 하나인 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
11 11
제9항에 있어서, 상기 임베딩하는 단계는, 토큰 임베딩(Token Embedding), 세그먼트 임베딩(Segment Embedding), 포지션 임베딩(Position Embedding) 중 하나 또는 복수의 방법을 동시에 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
12 12
제9항에 있어서, 상기 토큰화하는 단계는, 기설정된 길이의 음절, 단어, 어절 또는 BPE(Byte Pair Encoding) 토큰의 형태 중 하나의 형태로 토큰화하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
13 13
제9항에 있어서, 상기 문맥 예측 모델은, 통역 대상 언어의 위치를 서로 유사한 공간에 변환하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
14 14
제9항에 있어서, 상기 문맥 예측 모델은, 통역 대상 도메인이 특수한, 또는 제한된 도메인인 경우 일반적인 텍스트로 구성된 기본 다국어 임베딩 모델을 해당 도메인 텍스트 기반 파인 튜닝을 수행한 것을 특징으로 하는 문맥 기반 자동 통역 성능 학습 방법
15 15
사용자로부터 음성 신호를 입력받는 단계; 이전 발화가 존재하는지를 판단하는 단계; 상기 판단 단계에서 이전 발화가 존재하면, 문맥 인코더에 의해, 상기 이용하여 이전 발화에서 문맥 벡터를 추출하는 단계; 음성 인코더에 의해, 사용자의 음성 입력이 끝나면 사용자의 음성을 인코딩하는 단계; 통역 디코더에 의해, 문맥 인코더에 의해 추출된 문맥 벡터와 상기 음성 인코더에 의해 추출된 음성 벡터를 이용하여 통역을 수행하는 단계;를 포함하는 문맥 기반 자동 통역 성능 향상 방법
16 16
제15항에 있어서, 상기 판단 단계에서 상기 이전 발화가 존재하지 않으면, 통역 디코더에 의해, 상기 음성 인코더로부터 인코딩된 사용자의 음성 신호만을 이용하여 디코딩을 수행하는 단계를 포함하는 문맥 기반 자동 통역 성능 향상 방법
17 17
제15항에 있어서, 상기 문맥 벡터를 추출하는 단계는, 다국어 임베딩 언어 모델을 이용하는 것을 특징으로 하는 문맥 기반 자동 통역 성능 향상 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정부출연금사업(기관고유사업) 자율성장형 복합인공지능 원천기술연구