1 |
1
한글로 이루어진 텍스트의 어절을 구분하는 단계;상기 구분된 어절별로 적어도 하나의 형태소 분석열을 추출하는 단계;상기 추출된 적어도 하나의 형태소 분석열 및 동형이의어를 태깅하는 단계;한글 형태소 분석열의 태깅 결과와 한자가 대응되어 기 저장된 상태에서 품사 또는 어깨번호를 이용하여 상기 태깅하는 단계에서 태깅한 적어도 하나의 형태소 분석열을 문맥에 맞는 한자로 변환하는 단계를 포함하고, 상기 한자로 변환하는 단계는 텍스트에 포함된 한자로 변환 가능한 모든 형태소 분석열을 한자로 변환하거나 특정 형태소 분석열만을 한자로 변환하는 한글-한자 변환방법
|
2 |
2
제1항에 있어서,상기 추출하는 단계는,어절, 어절의 형태소별 품사 및 형태소별 품사 및 동형이의어의 빈도 정보를 포함하는 제1 데이터베이스로부터 상기 어절에 대응되는 상기 형태소 분석열을 추출하는 것을 특징으로 하는 한글-한자 변환 방법
|
3 |
3
제2항에 있어서,상기 태깅하는 단계는,상기 추출된 적어도 하나의 형태소 분석열의 생성 확률 및 전이 확률을 이용하여 상기 적어도 하나의 형태소 분석열을 태깅하는 것을 특징으로 하는 한글-한자 변환 방법
|
4 |
4
제3항에 있어서,상기 생성 확률은,상기 제1 데이터베이스로부터 추출되는 상기 형태소 분석열별 빈도 정보를 이용하여 결정되는 것을 특징으로 하는 한글-한자 변환 방법
|
5 |
5
제3항에 있어서,상기 전이 확률은,제2 데이터베이스에 기 저장된 형태소별 품사의 빈도 정보를 이용하여 결정되는 것을 특징으로 하는 한글-한자 변환 방법
|
6 |
6
제3항에 있어서,상기 태깅하는 단계는,은닉마르코프모델(HMM: Hidden Markov Model)을 이용하여 어절 간의 발생 빈도에 따라 전이 확률에 가중치를 적용하는 것을 특징으로 하는 한글-한자 변환 방법
|
7 |
7
제1항에 있어서,상기 태깅하는 단계는비터비(Viterbi) 알고리즘을 이용하여 상기 어절에 대해 각각의 형태소 분석열을 태깅하는 것을 특징으로 하는 한글-한자 변환 방법
|
8 |
8
삭제
|
9 |
9
한글로 이루어진 텍스트의 어절을 구분하는 어절 구분부;상기 구분된 어절별로 적어도 하나의 형태소 분석열을 추출하는 형태소 분석열 추출부;상기 추출된 적어도 하나의 형태소 분석열 및 동형이의어를 태깅하는 태깅부; 한글 형태소 분석열의 태깅 결과와 한자가 대응되어 기 저장된 상태에서 품사 또는 어깨번호를 이용하여 텍스트에 포함된 한자로 변환 가능한 모든 형태소 분석열 또는 특정 형태소 분석열을 문맥에 맞는 한자로 변환하는 변환부를 포함하는 한글-한자 변환을 위한 단말장치
|