1 |
1
자동 통역을 위한 단어 인식 장치에 있어서,문장 코퍼스(Corpus)를 N-gram 단위로 분리하고, 상기 분리된 N-gram단위의 의미 정보의 비교를 위하여 상기 의미 정보의 확률 빈도를 정규화(Normalize)한 N-gram 특징값을 생성하며, 상기 N-gram 특징값을 기초로 상기 N-gram단위의 의미 정보에 따른 N-gram 단위의 상대적 특징값을 생성하여, 상기 N-gram 단위의 의미 정보 및 상기 생성된 N-gram 단위의 상대적 특징값을 저장하는 의미 정보 데이터 관리부;의미 정보를 인식하기 위한 문장을 입력받는 문장 입력부; 및상기 입력받은 문장을 N-gram 단위로 분리하여, 상기 입력받은 문장의 N-gram 단위를 상기 의미 정보 데이터 관리부에 저장된 N-gram단위의 의미 정보 및 N-gram 단위의 상대적 특징값과 비교하여 상기 입력받은 문장에 포함된 단어의 의미 인식을 위한 태그를 부가하는 의미 인식부를 포함하고, 상기 의미 정보 데이터 관리부는상기 문장 코퍼스를 분리하여, 상기 문장 코퍼스에 포함된 개별 단어에 대한 의미를 연관하여 의미 정보를 설정하는 의미 정보 구축부; 및상기 설정된 의미 정보에 따라 문장 정보를 분류하여 저장하는 데이터 저장부를 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|
2 |
2
삭제
|
3 |
3
제1 항에 있어서, 상기 의미 정보 데이터 관리부는상기 문장 코퍼스에 저장되어 있는 의미 정보에 따라 문장 정보를 분류하여 저장된 데이터를 검사하여 중복되는 문장 정보를 제거하는 중복 데이터 제거부를 더 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|
4 |
4
제3 항에 있어서, 상기 의미 정보 데이터 관리부는상기 중복 데이터 제거부에 의하여 중복 문장 정보가 제거되어 상기 데이터 저장부에 저장된 문장 정보를 읽어들이고, 상기 읽어들인 문장 정보를 N-gram단위로 분리하여 N-gram 단위의 정보를 생성하는 N-gram 정보 생성부; 및 상기 생성된 N-gram 단위의 정보를 상호 비교하기 위하여 N-gram 단위의 특징값 및 상기 N-gram 단위의 특징값을 이용하여 단어의 의미를 구분하기 위해 사용되는 N-gram 단위의 상대적 특징값을 생성하는 N-gram 분석부를 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|
5 |
5
제4 항에 있어서, 상기 N-gram 정보 생성부는 Uni-gram, Bi-gram 또는 Tri-gram단위의 N-gram 단위로 정보를 생성하는 것을 특징으로 하는 단어 의미 인식 장치
|
6 |
6
제4 항에 있어서, 상기 N-gram 분석부는상기 문장 정보를 읽어들여 N-gram 단위로 생성된 N-gram 정보 중 동일한 N-gram 단위들을 집계하여, N-gram 단위별 빈도를 산출하는 N-gram 단위 특징값 계산부; 및 단어의 의미 정보와 상기 단어의 의미 정보에 따른 N-gram 단위의 특징값을 이용하여 상대적 특징값을 산출하는 N-gram 단위 상대적 특징값 계산부를 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|
7 |
7
제6 항에 있어서, 상기 N-gram 단위 특징값 계산부는로그 연산 또는 TF(Term Frequency)/IDF(Inversed Document Frequency)를 이용한 정규화를 이용하는 것을 특징으로 하는 단어 의미 인식 장치
|
8 |
8
제6 항에 있어서, 상기 N-gram 단위 상대적 특징값 계산부는개별 단어의 특징값들의 합에 대한 개별 단어의 특징값의 비율에 기초하여 N-gram 단위 상대적 특징값을 계산하는 것을 특징으로 하는 단어 의미 인식 장치
|
9 |
9
제1 항에 있어서, 상기 문장 입력부는음성 정보를 입력받아 상기 입력받은 음성 정보를 텍스트 문장으로 변환하는 음성 변환부를 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|
10 |
10
제1 항에 있어서, 상기 의미 인식부는상기 태그가 부착된 문장을 기초로 출력 신호를 생성하는 출력 신호 생성부를 포함하는 것을 특징으로 하는 단어 의미 인식 장치
|