1 |
1
미리 형태소들이 등록되어 있는 기분석사전을 이용하여 형태소 분석을 수행하는 형태소 분석기에 의해서 계산된 형태소 분석 대상 어절의 모든 후보의 점수가 추정 임계치 g이하이면, 미등록 명사가 포함된 추정 대상 어절이라고 판단하고 추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하며, 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하고 추정된 미등록 명사를 수집하는 미등록 명사 추정/수집부; 및 상기 형태소 분석 대상 어절에 대해 분석된 형태소를 태깅하고 상기 추정 대상 어절에 대해 추정된 미등록 명사를 태깅하는 태깅부;를 포함하는 형태소 분석기를 위한 미등록 명사 추정 장치
|
2 |
2
제 1 항에 있어서, 추정 대상 어절을 출력하는 디스플레이부; 및 상기 출력된 추정 대상 어절을 확인한 사용자로부터 미등록 명사 여부를 결정하는 결정 신호를 입력받는 입력부를 더 포함하며,상기 미등록 명사 추정/수집부는, 상기 미등록 명사 추정 후보의 가장 높은 점수가 반자동 임계치 이하이면 상기 추정 대상 어절의 출력 및 수집을 결정하고 상기 입력부로부터 입력된 사용자의 결정 신호가 미등록 명사를 나타내는 경우에 상기 추정 대상 어절이 미등록 명사임을 결정하는, 형태소 분석기를 위한 미등록 명사 추정 장치
|
3 |
3
제 1 항 또는 제 2 항에 있어서, 상기 미등록 명사 추정/수집부는, 상기 추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 그의 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하되,좌측부분에 대응되는 우측부분이 기분석 사전에 존재하는지를 확인하고, 기분석 사전에 존재하는 우측부분의 길이, 상기 좌측부분의 길이 및 수학식을 이용하여 상기 좌측부분의 빈도 점수를 계산하며,상기 계산된 좌측부분의 빈도 점수, 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값, 상기 좌측부분 및 상기 우측부분의 조합 가능성 정도를 곱하여 미등록 명사 추정 후보의 점수를 계산하는, 형태소 분석기를 위한 미등록 명사 추정 장치
|
4 |
4
제 3항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 이고, l은 미등록 명사 부분 점수이며, sr은 우측부분인 조사부분의 길이, sl은 좌측부분인 미등록 명사 부분의 길이, 그리고 a,b,c,d,e는 상수이며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은, r'=rf이고, r은 우측부분인 조사부분의 기분석 사전에 존재하는 빈도이며, r'는 수정된 빈도값이고, f는 상수인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 장치
|
5 |
5
형태소 분석시 미등록 명사를 추정 또는 인식하는 장치에 있어서,형태소 분석 대상 어절의 모든 후보의 점수가 추정 임계치 g 이하이면, 형태소 분석 대상 어절이 미등록 명사가 포함된 추정 대상 어절이라고 판단하여 미등록 명사 추정을 시도하는 제 1 단계;추정 대상 어절을 어절 길이의 경우의 수만큼 좌측부분과 우측부분으로 나누어 각 좌측부분 및 우측부분에 대하여 미등록 명사 추정 후보의 점수를 계산하는 제 2 단계; 및 가장 높은 점수의 미등록 명사 추정 후보를 미등록 명사로 추정하는 제 3 단계;를 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
|
6 |
6
제 5항에 있어서, 상기 미등록 명사 추정 후보들의 가장 높은 점수가 반자동 임계치 이하이면 상기 추정 대상 어절을 출력하는 단계; 및상기 추정 대상 어절을 확인한 사용자로부터 미등록 명사 여부를 결정하는 결정 신호를 입력받아 미등록 명사 여부를 결정하는 단계를 더 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
|
7 |
7
제 5 항 또는 제 6 항에 있어서, 상기 제 2 단계는,좌측부분에 대응되는 우측부분이 기분석 사전에 존재하는지를 확인하는 단계;기분석 사전에 존재하는 우측부분의 길이, 상기 좌측부분의 길이 및 수학식을 이용하여 상기 좌측부분의 빈도 점수를 계산하는 단계; 및상기 계산된 좌측부분의 빈도 점수, 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값, 상기 좌측부분 및 상기 우측부분의 조합 가능성 정도를 곱하여 미등록 명사 추정 후보의 점수를 계산하는 단계를 포함하는 형태소 분석기를 위한 미등록 명사 추정 방법
|
8 |
8
제 7 항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 상기 우측부분의 길이가 길수록 점수가 높아지고 상기 좌측부분의 길이가 길수록 점수가 낮아지게 계산되도록 형성되며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은,상기 기분석 사전에 존재하는 조사 부분의 길이가 짧을수록 후보 점수가 높아지는 성향을, 길이가 길수록 점수가 높아지도록 보상하기 위하여 수정된 값인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
|
9 |
9
제 7 항에 있어서, 상기 좌측부분의 빈도 점수를 계산하기 위한 상기 수학식은, 이고, l은 미등록 명사 부분 점수이며, sr은 우측부분인 조사부분의 길이, sl은 좌측부분인 미등록 명사 부분의 길이, 그리고 a,b,c,d,e는 상수이며,상기 기분석 사전에 존재하는 우측부분의 빈도로부터 수정된 빈도값은, r'=rf이고, r은 우측부분인 조사부분의 기분석 사전에 존재하는 빈도이며, r'는 수정된 빈도값이고, f는 상수인 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
|
10 |
10
제 5 항 또는 제 6 항에 있어서, 상기 제 2 단계는,좌측부분의 길이가 1개인 경우부터 어절 전체 길이인 경우까지 순차적으로 반복 수행되는 것을 특징으로 하는 형태소 분석기를 위한 미등록 명사 추정 방법
|