1 |
1
통계적 기계 번역에서 대역 쌍 추출을 위한 장치로서, 소스 언어 문장으로부터 추출된 소스 언어의 명사구와 타겟 언어 문장으로부터 추출된 타겟 언어의 명사구 후보간 정렬 확률을 기반으로 대역 쌍 스코어를 산출하는 대역쌍 스코어 산출기; 및상기 산출된 스코어들을 기반으로 대역 쌍을 추출하는 대역쌍 추출기를 포함하며,상기 대역쌍 스코어 산출기는,상기 정렬 확률 분석 시 상기 타겟 언어의 명사구 후보의 추출 제약과 관련되는 제약기준조건이 만족되는 지의 여부를 판단한 결과에 기초하여 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
2 |
2
제 1 항에 있어서, 상기 소스 언어 문장을 구문 분석한 결과로부터 상기 소스 언어의 명사구를 추출하는 소스 언어 명사구 추출기; 및상기 타겟 언어 문장을 형태소 단위로 분석한 결과로부터 확인되는 상기 타겟 언어 문장의 품사 정보를 기반으로 상기 소스 언어의 명사구와 대응 가능한 타겟 언어의 명사구 후보를 추출하는 타겟 언어 명사구 후보 추출기를 더 포함하며,상기 타겟 언어 문장을 형태소 분석한 결과는 정렬 알고리즘을 통해 단어 정렬한 결과를 포함하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
3 |
3
제 1 항에 있어서,상기 대역쌍 스코어 산출기는 상기 소스 언어의 명사구 내 명사/단어/명사구 개수, 상기 타겟 언어의 명사구 후보 내 명사/단어/명사구 개수, 합집합(union) 또는 교집합(intersection) 단어 정렬에 의해 소스 언어의 명사와 타겟 언어의 명사가 정렬된 링크 수, 한 쪽 언어만 명사구 대역 쌍 후보 내에 걸친 단어/명사 정렬 링크 수 중 하나 또는 하나 이상을 합산하여 산출하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
4 |
4
제 1 항에 있어서,상기 대역쌍 추출기는,상기 스코어들 중에서 가장 높은 스코어를 갖는 대역 쌍을 추출하며, 상기 가장 높은 스코어를 갖는 대역 쌍이 여러 개일 경우 모든 대역 쌍을 추출하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
5 |
5
제 1 항에 있어서, 상기 제약기준조건은,상기 소스 언어의 명사구와 상기 타겟 언어의 명사구 후보 내 합집합 정렬이 존재하지 않은 제1 조건, 상기 소스 언어의 명사구 및 상기 타겟 언어의 명사구 후보 중 어느 하나인 제1 명사구의 명사의 개수가 나머지 다른 하나인 제2 명사구의 명사의 개수보다 제1 임계치 이상인 제2 조건, 및 상기 제1 명사구의 언어의 길이가 상기 제2 명사구의 언어의 길이보다 제2 임계치 이상인 제3 조건을 포함하며,상기 대역쌍 스코어 산출기는,상기 제1 조건, 상기 제2 조건, 상기 제3 조건 중 어느 하나가 만족되면, 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
6 |
6
제 5 항에 있어서,상기 제1 조건은, 상기 소스 언어의 명사구와 상기 타겟 언어의 명사구 후보 내 합집합 정렬이 한 개도 없는 경우이며,상기 제2 조건은, 제1 명사구의 명사의 개수가 제2 명사구의 명사의 개수의 3개 이상인 경우이며,상기 제3 조건은, 상기 제1 명사구의 언어의 길이(단어나 형태소의 개수)가 상기 제2 명사구의 언어의 5배 이상인 경우인 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 장치
|
7 |
7
[청구항 7은(는) 설정등록료 납부시 포기되었습니다
|
8 |
8
통계적 기계 번역에서 대역 쌍 추출을 위한 단말기로서, 소스 언어 문장으로부터 추출된 소스 언어의 명사구와 타겟 언어 문장으로부터 추출된 타겟 언어의 명사구 후보간 정렬 확률을 기반으로 대역 쌍 스코어를 산출하는 대역쌍 스코어 산출기; 및상기 산출된 스코어들을 기반으로 대역 쌍을 추출하는 대역쌍 추출기를 포함하며,상기 대역쌍 스코어 산출기는,상기 정렬 확률 분석 시 상기 타겟 언어의 명사구 후보의 추출 제약과 관련되는 제약기준조건이 만족되는 지의 여부를 판단한 결과에 기초하여 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 단말기
|
9 |
9
[청구항 9은(는) 설정등록료 납부시 포기되었습니다
|
10 |
10
[청구항 10은(는) 설정등록료 납부시 포기되었습니다
|
11 |
11
[청구항 11은(는) 설정등록료 납부시 포기되었습니다
|
12 |
12
[청구항 12은(는) 설정등록료 납부시 포기되었습니다
|
13 |
13
[청구항 13은(는) 설정등록료 납부시 포기되었습니다
|
14 |
14
형태소 단위로 분석된 타겟 언어 말뭉치에 품사 정보를 부착하고, 상기 형태소 단위로 분석된 타겟 언어 말뭉치로부터 품사 정보를 이용하여 타겟 언어의 명사구 후보를 추출하되,상기 타겟 언어의 명사구 후보와 다른 언어의 명사구간의 정렬 확률 분석 시 상기 타겟 언어의 명사구 후보의 추출 제약과 관련되는 제약기준조건이 만족되는 지의 여부를 판단한 결과에 기초하여 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 명사구 대역쌍 추출 장치
|
15 |
15
제 14 항에 있어서, 상기 명사구 후보는 상기 타겟 언어 말뭉치를 단어 정렬한 결과에서 명사구를 구성할 수 있는 품사를 모두 추출함에 따라 생성하며,상기 명사구를 구성할 수 있는 품사는 명사구 시작에만 가능한 품사, 명사구 끝에만 가능한 품사, 명사구 시작과 끝은 되지 않지만 3개 이상의 형태소로 구성된 명사구 중간에는 가능한 품사, 명사구 어느 위치에도 가능한 품사를 포함하는 것을 특징으로 하는 명사구 대역쌍 추출 장치
|
16 |
16
[청구항 16은(는) 설정등록료 납부시 포기되었습니다
|
17 |
17
[청구항 17은(는) 설정등록료 납부시 포기되었습니다
|
18 |
18
[청구항 18은(는) 설정등록료 납부시 포기되었습니다
|
19 |
19
통계적 기계 번역에서 대역 쌍 추출을 위해 명사구 대역 쌍 추출 장치에서 수행되는 방법으로서, 소스 언어 문장으로부터 추출된 소스 언어의 명사구와 타겟 언어 문장으로부터 추출된 타겟 언어의 명사구 후보간 정렬 확률을 기반으로 대역 쌍 스코어를 산출하는 단계; 및상기 산출된 스코어들을 기반으로 대역 쌍을 추출하는 단계를 포함하며,상기 대역 쌍 스코어를 산출하는 단계는,상기 정렬 확률 분석 시 상기 타겟 언어의 명사구 후보의 추출 제약과 관련되는 제약기준조건이 만족되는 지의 여부를 판단한 결과에 기초하여 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 통계적 기계 번역에서 명사구 대역 쌍 추출 방법
|
20 |
20
[청구항 20은(는) 설정등록료 납부시 포기되었습니다
|
21 |
21
[청구항 21은(는) 설정등록료 납부시 포기되었습니다
|
22 |
22
[청구항 22은(는) 설정등록료 납부시 포기되었습니다
|
23 |
23
[청구항 23은(는) 설정등록료 납부시 포기되었습니다
|
24 |
24
명사구 대역 쌍 추출 장치에서 수행되는 방법으로서, 형태소 단위로 분석된 타겟 언어 말뭉치에 품사 정보를 부착하고, 상기 형태소 단위로 분석된 타겟 언어 말뭉치를 단어 정렬한 결과로부터 품사 정보를 이용하여 타겟 언어의 명사구 후보를 추출하되,상기 타겟 언어의 명사구 후보와 다른 언어의 명사구간의 정렬 확률 분석 시 상기 타겟 언어의 명사구 후보의 추출 제약과 관련되는 제약기준조건이 만족되는 지의 여부를 판단한 결과에 기초하여 상기 타겟 언어의 명사구 후보를 제거하는 것을 특징으로 하는 명사구 대역쌍 추출 방법
|
25 |
25
[청구항 25은(는) 설정등록료 납부시 포기되었습니다
|
26 |
26
[청구항 26은(는) 설정등록료 납부시 포기되었습니다
|
27 |
27
[청구항 27은(는) 설정등록료 납부시 포기되었습니다
|