1 |
1
메모리 및 프로세서를 구비하는 컴퓨터에 의해 수행되는 방법에 있어서,원시언어 문장을 입력문으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스를 입력받는 단계;상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보를 생성하는 단계;상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계; 및상기 양국어 코퍼스 및 상기 행위열 정보를 기반으로 상기 동시통역 모델을 학습하는 단계를 포함하되,상기 제1 및 제2 행위는 상기 입력문의 단어를 읽는 읽기행위이거나 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위인 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
2 |
2
제1항에 있어서,상기 제1 행위가 읽기 행위이고 상기 제2 행위가 쓰기행위인 경우, 상기 쓰기행위는 상기 읽기행위에 상응하는 단어를 직접적으로 중간 통역한 결과를 출력하는 것 또는, 상기 읽기행위에 상응하는 단어의 위치에 올 것으로 예측되는 단어를 중간 통역한 결과를 출력하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
3 |
3
제1항에 있어서,상기 양국어 코퍼스에서의 단어에 상응하는 정렬정보를 생성하는 단계는,상기 양국어 코퍼스의 입력문에서의 단어와 대응하는 상기 출력문에서의 단어의 각 인덱스를 매칭시켜 상기 정렬정보를 생성하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
4 |
4
제3항에 있어서,상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계는,상기 동시통역 모델에서 현재까지의 읽기행위에 상응하는 입력문의 단어에 대한 제1 입력단어 인덱스를 추출하는 단계;상기 현재까지의 읽기행위 이전의 쓰기행위에 상응하는 출력문의 단어에 대한 제1 출력단어 인덱스를 추출하는 단계;상기 제1 출력단어 인덱스 이후에 출력되어야 할 제2 출력단어 인덱스를 갖는 출력문의 단어의 정렬정보에 기초하여, 상기 제2 출력단어 인덱스와 정렬관계를 갖는 입력문의 단어를 추출하는 단계;상기 추출된 입력문의 단어들 중 가장 큰 인덱스를 갖는 단어와 상기 제1 입력단어 인덱스를 비교하는 단계; 및상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
5 |
5
제4항에 있어서,상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계는,상기 제1 입력단어 인덱스가 상기 가장 큰 인덱스보다 더 작은 경우 상기 행위열 정보에 읽기행위를 기록하고, 상기 제1 입력단어 인덱스가 상기 가장 큰 인덱스 이상인 경우 상기 행위열 정보에 쓰기행위를 기록하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
6 |
6
제5항에 있어서,상기 비교 결과에 기초하여 상기 행위열 정보에 읽기행위 또는 쓰기행위를 기록하는 단계는,상기 행위열 정보에 읽기행위를 기록한 이후, 상기 제1 입력단어 인덱스의 다음 인덱스에 상응하는 입력문의 단어에 대한 제2 입력단어 인덱스를 상기 가장 큰 인덱스와 비교하는 단계 및상기 제2 입력단어 인덱스가 상기 가장 큰 인덱스보다 더 작은 경우 상기 행위열 정보에 읽기행위를 기록하고, 상기 제2 입력단어 인덱스가 상기 가장 큰 인덱스 이상인 경우 상기 행위열 정보에 쓰기행위를 기록하는 단계를 더 포함하는, 외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
7 |
7
제4항에 있어서,상기 정렬정보에 기초하여 상기 동시통역 모델에서의 제1 행위에 후속되는 제2 행위를 결정하여 행위열 정보를 생성하는 단계는,상기 제1 행위에 후속되는 상기 제2 행위로 소정의 횟수만큼의 읽기행위를 더 수행하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
8 |
8
제1항에 있어서,상기 양국어 코퍼스 및 상기 행위열 정보를 기반으로 상기 동시통역 모델을 학습하는 단계는,상기 행위열 정보의 읽기행위를 기 설정된 특수기호로 대체하고, 쓰기행위를 출력문에서의 출력단어로 대체한 행위결합 출력문을 생성하는 단계; 및상기 입력문과 상기 행위결합 출력문을 기반으로 상기 동시통역 모델을 학습하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
9 |
9
제8항에 있어서,상기 입력문과 상기 행위결합 출력문을 기반으로 상기 동시통역 모델을 학습하는 단계는,현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을 상기 동시통역 모델의 인코더로 입력하는 단계; 및상기 현재 시간 t에서 상기 입력문에 상응하는 출력문을 상기 동시통역 모델의 디코더에서 출력하는 단계를 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
10 |
10
제9항에 있어서,현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을 상기 동시통역 모델의 인코더로 입력하는 단계는,상기 현재 시간 t에서 현재까지의 입력으로 주어진 상기 입력문들을, 상기 현재 시간 t에서 상기 출력문이 출력되기 위하여, 상기 인코더가 참조해야 하는 이전 문맥 단어 개수에 대한 단조 감소함수의 형태로 상기 동시통역 모델의 인코더로 입력하는 것인,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
11 |
11
제1항에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 생성하는 단계;상기 음성인식 결과를 상기 학습된 동시통역 모델로 입력하는 단계;상기 동시통역 모델에서 상기 읽기행위 및 상기 쓰기행위 중 어느 하나의 행위를 선택하는 단계; 및상기 선택된 행위를 수행한 통역 결과를 제공하는 단계를 더 포함하는,외부 정렬정보에 기반한 실시간 동시통역 모델의 학습 방법
|
12 |
12
메모리 및 프로세서를 구비하는 컴퓨터에 의해 수행되는 방법에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 생성하는 단계;상기 음성인식 결과를 미리 학습된 동시통역 모델로 입력하는 단계;상기 동시통역 모델에서 상기 발화자의 음성을 더 입력받는 읽기행위 및 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위 중 어느 하나의 행위를 선택하는 단계; 및상기 선택된 행위에 기반한 통역 결과를 제공하는 단계를 포함하되,상기 미리 학습된 동시통역 모델은, 원시언어 문장을 입력문으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스와, 상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보에 기초하여 학습되는 것인,외부 정렬정보에 기반하여 학습된 동시통역 모델을 이용한 실시간 동시통역 방법
|
13 |
13
외부 정렬정보에 기반한 실시간 동시통역 시스템에 있어서,실시간으로 발화자가 발화한 음성에 대한 음성인식 결과를 수신하고, 상기 발화한 음성에 대응되는 동시통역 결과를 출력하는 통신모듈,미리 학습된 동시통역 모델에 기초하여 상기 동시통역 결과를 생성 및 제공하기 위한 프로그램이 저장된 메모리 및 상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함하고,상기 프로세서는 상기 프로그램을 실행시킴에 따라, 상기 동시통역 모델에서 상기 발화자의 음성을 더 입력받는 읽기행위 및 현재까지의 읽기행위에 상응하는 중간 통역 결과를 출력하는 쓰기행위 중 어느 하나의 행위를 선택하고, 상기 선택된 행위에 기반한 통역 결과를 제공하되, 상기 프로세서는 원시언어 문장을 입력으로 하고 목적언어 문장을 출력문으로 하는 양국어 코퍼스와, 상기 양국어 코퍼스에서의 단어 또는 토큰(이하, 단어)에 상응하는 정렬정보에 기초하여 상기 동시통역 모델을 학습하는 것인,외부 정렬정보에 기반한 실시간 동시통역 시스템
|