1 |
1
기계번역 시스템이 임의의 문장을 기계번역 하는 방법으로서,기계번역 모듈을 학습시키기 위한 특정 소스 언어와 특정 타깃 언어를 입력 받는 단계,복수의 소스 언어들과 복수의 타깃 언어들로 작성된 다중-언어 병렬 코퍼스 후보군 중, 소스 언어가 상기 수신한 특정 소스 언어이거나 타깃 언어가 상기 수신한 특정 타깃 언어인 복수의 후보 병렬 코퍼스들을 선택하는 단계,상기 복수의 후보 병렬 코퍼스들에 포함된 문장들 중, 각 소스 문장이 번역된 타깃 언어에 해당하는 태그를 각 소스 문장에 삽입하고, 태그가 삽입된 소스 문장과 상기 소스 문장이 번역된 타깃 문장을 포함하는 학습 데이터를 생성하는 단계, 그리고상기 학습 데이터를 이용하여 각 소스 문장이 삽입된 태그에 따라 상기 타깃 문장으로 번역되도록 저자원 기계번역 모듈을 학습시키는 단계를 포함하는, 기계번역 방법
|
2 |
2
제1항에 있어서,상기 후보 병렬 코퍼스들을 선택하는 단계는,상기 복수의 다중-언어 병렬 코퍼스 후보군 중 소스 언어가 상기 특정 소스 언어에 해당하는 다중-언어 병렬 코퍼스들과, 타깃 언어가 상기 특정 타깃 언어에 해당하는 다중-언어 병렬 코퍼스들을 상기 후보 병렬 코퍼스들로 선택하는, 기계번역 방법
|
3 |
3
제2항에 있어서,상기 학습 데이터를 생성하는 단계는,상기 후보 병렬 코퍼스들에 포함된 소스 문장들에서 단어들을 분리하는 단계를 더 포함하는, 기계번역 방법
|
4 |
4
제3항에 있어서,상기 단어들을 분리하는 단계 이후에,상기 분리된 단어들을 하위 단어 인코딩하는 단계를 포함하고,상기 하위 단어 인코딩은 BPE(Byte Pair Encoding) 알고리즘을 이용하여 인코딩하는, 기계번역 방법
|
5 |
5
제1항에 있어서,상기 학습 데이터를 생성하는 단계는,상기 후보 병렬 코퍼스들에 포함된 문장들을 병합하는 단계를 더 포함하는, 기계번역 방법
|
6 |
6
제1항에 있어서,상기 기계번역 모듈은,상기 소스 문장을 의미 벡터로 변환하도록 학습된 인코더와,상기 의미 벡터를 이용하여 상기 타깃 언어로 작성된 문장을 생성하도록 학습된 디코더를 포함하는, 기계번역 방법
|
7 |
7
제1항에 있어서,상기 기계번역 모듈을 학습시키는 단계 이후에,상기 특정 소스 언어로 작성된 임의의 문장과, 상기 문장을 번역할 상기 특정 타깃 언어에 대한 언어 정보를 수신하는 단계, 그리고상기 임의의 문장을 학습된 기계번역 모듈을 이용하여 상기 번역할 타깃 언어로 작성된 문장으로 번역하는 단계를 포함하는, 기계번역 방법
|
8 |
8
제7항에 있어서,상기 언어 정보를 수신하는 단계는,상기 특정 소스 언어에 대한 언어 정보도 추가로 수신하는, 기계번역 방법
|
9 |
9
문장을 기계 번역하는 시스템으로서,복수의 다중-언어 병렬 코퍼스들이 저장되어 있는 스토리지,외부로부터 특정 소스 언어 정보와 특정 타깃 언어 정보를 수신하는 인터페이스, 그리고프로세서를 포함하고,상기 프로세서는,상기 수신한 특정 소스 언어 정보와 특정 타깃 언어 정보를 토대로 상기 복수의 다중-언어 병렬 코퍼스들 중 후보 병렬 코퍼스를 추출하고, 추출한 후보 병렬 코퍼스를 구성하는 소스 문장들 각각에 각 소스 문장이 번역된 타깃 언어의 태그를 삽입하고, 태그가 삽입된 각 소스 문장과 상기 각 소스 문장이 번역된 타깃 문장들을 이용하여 기계번역 모듈을 학습시키고, 학습된 기계번역 모듈에 상기 수신한 소스 언어 정보에 대응하는 소스 언어로 작성된 소스 문장을 입력하여 상기 타깃 언어 정보에 대응하는 타깃 언어로 번역하는, 기계번역 시스템
|
10 |
10
제9항에 있어서,상기 프로세서는,상기 복수의 다중-언어 병렬 코퍼스 후보군들 중 소스 언어가 상기 수신한 소스 언어에 해당하는 다중-언어 병렬 코퍼스들과, 타깃 언어가 상기 수신한 타깃 언어에 해당하는 다중-언어 병렬 코퍼스들을 상기 후보 병렬 코퍼스들로 선택하는, 기계번역 시스템
|
11 |
11
제10항에 있어서,상기 프로세서는,상기 후보 병렬 코퍼스들에 포함된 소스 문장들에서 단어들을 분리하고, 상기 분리된 단어들을 하위 단어 인코딩하는, 기계번역 시스템
|
12 |
12
제11항에 있어서,상기 프로세서는,상기 후보 병렬 코퍼스들에 포함된 문장들을 병합하는, 기계번역 시스템
|