맞춤기술찾기

이전대상기술

외부 정렬정보에 기반한 실시간 동시통역 모델 학습 방법, 동시통역 방법 및 시스템

  • 기술번호 : KST2022004814
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법이 제공된다. 상기 방법은 원시언어 문장을 입력문으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스를 입력받는 단계; 상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보를 생성하는 단계; 상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계; 및 상기 양국어 코퍼스 및 상기 행위열 정보를 기반으로 상기 동시통역 모델을 학습하는 단계를 포함하되, 상기 제1 및 제2 행위는 상기 입력문의 단어를 읽는 읽기행위이거나 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위에 해당한다.
Int. CL G06F 40/58 (2020.01.01) G06F 40/284 (2020.01.01) G06F 40/189 (2020.01.01) G06N 20/00 (2019.01.01) G10L 15/04 (2006.01.01) G10L 15/06 (2006.01.01) G10L 15/22 (2006.01.01)
CPC G06F 40/58(2013.01) G06F 40/284(2013.01) G06F 40/189(2013.01) G06N 20/00(2013.01) G10L 15/04(2013.01) G10L 15/063(2013.01) G10L 2015/221(2013.01)
출원번호/일자 1020200141062 (2020.10.28)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2022-0056462 (2022.05.06) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.04.26)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 서영애 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인지명 대한민국 서울특별시 강남구 남부순환로**** 차우빌딩*층

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.10.28 수리 (Accepted) 1-1-2020-1146345-22
2 [심사청구]심사청구서·우선심사신청서
2021.04.26 수리 (Accepted) 1-1-2021-0487501-13
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
메모리 및 프로세서를 구비하는 컴퓨터에 의해 수행되는 방법에 있어서,원시언어 문장을 입력문으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스를 입력받는 단계;상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보를 생성하는 단계;상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계; 및상기 양국어 코퍼스 및 상기 행위열 정보를 기반으로 상기 동시통역 모델을 학습하는 단계를 포함하되,상기 제1 및 제2 행위는 상기 입력문의 단어를 읽는 읽기행위이거나 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위인 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
2 2
제1항에 있어서,상기 제1 행위가 읽기 행위이고 상기 제2 행위가 쓰기행위인 경우, 상기 쓰기행위는 상기 읽기행위에 상응하는 단어를 직접적으로 중간 통역한 결과를 출력하는 것 또는, 상기 읽기행위에 상응하는 단어의 위치에 올 것으로 예측되는 단어를 중간 통역한 결과를 출력하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
3 3
제1항에 있어서,상기 양국어 코퍼스에서의 단어에 상응하는 정렬정보를 생성하는 단계는,상기 양국어 코퍼스의 입력문에서의 단어와 대응하는 상기 출력문에서의 단어의 각 인덱스를 매칭시켜 상기 정렬정보를 생성하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
4 4
제3항에 있어서,상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계는,상기 동시통역 모델에서 현재까지의 읽기행위에 상응하는 입력문의 단어에 대한 제1 입력단어 인덱스를 추출하는 단계;상기 현재까지의 읽기행위 이전의 쓰기행위에 상응하는 출력문의 단어에 대한 제1 출력단어 인덱스를 추출하는 단계;상기 제1 출력단어 인덱스 이후에 출력되어야 할 제2 출력단어 인덱스를 갖는 출력문의 단어의 정렬정보에 기초하여, 상기 제2 출력단어 인덱스와 정렬관계를 갖는 입력문의 단어를 추출하는 단계;상기 추출된 입력문의 단어들 중 가장 큰 인덱스를 갖는 단어와 상기 제1 입력단어 인덱스를 비교하는 단계; 및상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
5 5
제4항에 있어서,상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계는,상기 제1 입력단어 인덱스가 상기 가장 큰 인덱스보다 더 작은 경우 상기 행위열 정보에 읽기행위를 기록하고, 상기 제1 입력단어 인덱스가 상기 가장 큰 인덱스 이상인 경우 상기 행위열 정보에 쓰기행위를 기록하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
6 6
제5항에 있어서,상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계는,상기 행위열 정보에 읽기행위를 기록한 이후, 상기 제1 입력단어 인덱스의 다음 인덱스에 상응하는 입력문의 단어에 대한 제2 입력단어 인덱스를 상기 가장 큰 인덱스와 비교하는 단계 및상기 제2 입력단어 인덱스가 상기 가장 큰 인덱스보다 더 작은 경우 상기 행위열 정보에 읽기행위를 기록하고, 상기 제2 입력단어 인덱스가 상기 가장 큰 인덱스 이상인 경우 상기 행위열 정보에 쓰기행위를 기록하는 단계를 더 포함하는, 외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
7 7
제4항에 있어서,상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계는,상기 제1 행위에 후속되는 상기 제2 행위로 소정의 횟수만큼의 읽기행위를 더 수행하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
8 8
제1항에 있어서,상기 양국어 코퍼스 및 상기 행위열 정보를 기반으로 상기 동시통역 모델을 학습하는 단계는,상기 행위열 정보의 읽기행위를 기 설정된 특수기호로 대체하고, 쓰기행위를 출력문에서의 출력단어로 대체한 행위결합 출력문을 생성하는 단계; 및상기 입력문과 상기 행위결합 출력문을 기반으로 상기 동시통역 모델을 학습하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
9 9
제8항에 있어서,상기 입력문과 상기 행위결합 출력문을 기반으로 상기 동시통역 모델을 학습하는 단계는,현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을 상기 동시통역 모델의 인코더로 입력하는 단계; 및상기 현재 시간 t에서 상기 입력문에 상응하는 출력문을 상기 동시통역 모델의 디코더에서 출력하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
10 10
제9항에 있어서,현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을 상기 동시통역 모델의 인코더로 입력하는 단계는,상기 현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을, 상기 현재 시간 t에서 상기 출력문이 출력되기 위하여, 상기 인코더가 참조해야 하는 이전 문맥 단어 개수에 대한 단조 감소함수의 형태로 상기 동시통역 모델의 인코더로 입력하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
11 11
제1항에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 생성하는 단계;상기 음성인식 결과를 상기 학습된 동시통역 모델로 입력하는 단계;상기 동시통역 모델에서 상기 읽기행위 및 상기 쓰기행위 중 어느 하나의 행위를 선택하는 단계; 및상기 선택된 행위를 수행한 통역 결과를 제공하는 단계를 더 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
12 12
메모리 및 프로세서를 구비하는 컴퓨터에 의해 수행되는 방법에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 생성하는 단계;상기 음성인식 결과를 미리 학습된 동시통역 모델로 입력하는 단계;상기 동시통역 모델에서 상기 발화자의 음성을 더 입력받는 읽기행위 및 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위 중 어느 하나의 행위를 선택하는 단계; 및상기 선택된 행위에 기반한 통역 결과를 제공하는 단계를 포함하되,상기 미리 학습된 동시통역 모델은, 원시언어 문장을 입력문으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스와, 상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보에 기초하여 학습되는 것인,외부 정렬정보에 기반하여 학습된 동시통역 모델을 이용한 실시간 동시통역 방법
13 13
외부 정렬정보에 기반한 실시간 동시통역 시스템에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 수신하고, 상기 발화한 음성에 대응되는 동시통역 결과를 출력하는 통신모듈,미리 학습된 동시통역 모델에 기초하여 상기 동시통역 결과를 생성 및 제공하기 위한 프로그램이 저장된 메모리 및 상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함하고,상기 프로세서는 상기 프로그램을 실행시킴에 따라, 상기 동시통역 모델에서 상기 발화자의 음성을 더 입력받는 읽기행위 및 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위 중 어느 하나의 행위를 선택하고, 상기 선택된 행위에 기반한 통역 결과를 제공하되, 상기 프로세서는 원시언어 문장을 입력으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스와, 상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보에 기초하여 상기 동시통역 모델을 학습하는 것인,외부 정렬정보에 기반한 실시간 동시통역 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 SW컴퓨팅산업원천기술개발사업 지식증강형 실시간 동시통역 원천기술 개발