1 |
1
사용자로부터 문장을 입력받는 입력부;말뭉치를 데이터베이스로 저장하는 말뭉치 데이터베이스부;상기 입력부를 통해 입력된 문장에 대하여 유사도 계산을 위한 언어처리를 수행하는 언어 처리부;상기 말뭉치 데이터베이스부에 저장된 후보 말뭉치들에 대해 상기 언어 처리부에 의해 언어처리된 문장과의 유사도를 검색하여 유사도가 일정값 이상인 문장을 추출하는 유사도 검색부; 및상기 유사도 검색부에 의해 추출된 문장이 다수인 경우, 추출된 문장들의 순위를 결정하는 순위 결정부;를 포함하되, 상기 순위 결정부는 상기 순위가 결정되면, 동일한 문장을 축소시키기 위하여 순위가 결정된 상기 문장들 사이의 유사도를 측정하여 측정된 상기 유사도가 일정값 이상인 문장들을 제거한 후 나머지 문장들을 그룹화하는 그룹핑부를 포함하고,상기 순위는 다음의 수학식 (순위 재조정값 = 유사도A + 검색된 문장의 빈도B + 검색된 문장의 n-gram 확률C + n-gram 유사도D)에 의해 구하되 여기서, A, B, C, 및 D는 가중치로서, A, B, C, 및 D의 합은 1이며,상기 유사도는 다음의 수학식 에 의해 구하되, 여기서 S1은 입력문장, S2는 후보문장, e1,i는 입력문장의 i번째 요소, e2,i는 후보문장의 i번째 요소, fi는 i번째 요소에 대한 유사도 함수, wi는 fi의 가중치인 것을 특징으로 하는 유사문장 검색장치
|
2 |
2
제1 항에 있어서,상기 언어 처리부는,상기 입력부를 통해 입력된 문장에 대해 의미가 없는 단어들을 제거하는 가비지(garbage) 제거부;상기 가비지 제거부에 의해 가비지가 제거된 문장에 대해 형태소 품사 태거를 수행하는 형태소 품사 태거부;상기 문장의 문형 및 시제를 확인하는 문형 및 시제 확인부;상기 형태소 품사태거가 수행된 문장에 대해 키워드를 추출하는 키워드 추출부;상기 문장에 대해 용언의 기본형을 검색하는 용언 기본형 검색부; 및상기 문장에 포함된 고유명사에 대해 클래스 태깅을 수행하는 클래스 태깅부;를 포함하는 것을 특징으로 하는 유사문장 검색장치
|
3 |
3
제1 항에 있어서,상기 유사도 검색부는,상기 언어처리된 문장과 말뭉치 데이터베이스부의 후보 말뭉치들에 대해 유사도를 계산하는 유사도 계산부;상기 후보 말뭉치들 중 유사도 계산부에 의해 계산된 유사도가 일정값 이상인 문장을 추출하는 문장 추출부; 및상기 추출된 문장의 클래스에 대해 상기 입력부를 통해 입력된 문장의 클래스로 복원하는 클래스 복원부;를 포함하는 것을 특징으로 하는 유사문장 검색장치
|
4 |
4
제1 항에 있어서,상기 순위 결정부는,계산된 상기 유사도의 확률과 추출된 상기 문장의 빈도, n-gram 확률값, 상기 입력된 문장의 n-gram, 추출된 상기 문장의 n-gram의 유사도 중 적어도 하나에 기초하여 상기 추출된 문장들의 순위를 결정하는 것을 특징으로 하는 유사문장 검색장치
|
5 |
5
삭제
|
6 |
6
사용자로부터 문장을 입력받는 단계;입력된 상기 문장에 대하여 유사도 계산을 위한 언어처리를 수행하는 단계;말뭉치 데이터베이스부에 저장된 후보 말뭉치들에 대해 상기 언어처리가 수행된 문장과의 유사도를 검색하여 유사도가 일정값 이상인 문장을 추출하는 단계; 및추출된 상기 문장이 다수인 경우, 추출된 문장들의 순위를 결정하는 단계;를 포함하되, 상기 결정하는 단계는 상기 순위가 결정되면, 동일한 문장을 축소시키기 위하여 순위가 결정된 상기 문장들 사이의 유사도를 측정하여 측정된 상기 유사도가 일정값 이상인 문장들을 제거한 후 나머지 문장들을 그룹화하는 단계를 포함하고,상기 순위는 다음의 수학식 (순위 재조정값 = 유사도A + 검색된 문장의 빈도B + 검색된 문장의 n-gram 확률C + n-gram 유사도D)에 의해 구하되 여기서, A, B, C, 및 D는 가중치로서, A, B, C, 및 D의 합은 1이며,상기 유사도는 다음의 수학식 에 의해 구하되, 여기서 S1은 입력문장, S2는 후보문장, e1,i는 입력문장의 i번째 요소, e2,i는 후보문장의 i번째 요소, fi는 i번째 요소에 대한 유사도 함수, wi는 fi의 가중치인 것을 특징으로 하는 유사문장 검색방법
|
7 |
7
제6 항에 있어서,상기 언어 처리단계는,입력된 상기 문장에 대해 가비지를 제거하는 단계;상기 가비지가 제거된 문장에 대해 형태소 품사 태거를 수행하는 단계;상기 문장의 문형 및 시제를 확인하는 단계;상기 형태소 품사 태거가 수행된 문장에 대해 키워드를 추출하는 단계;상기 문장에 대해 용언의 기본형을 검색하는 단계; 및상기 문장에 포함된 고유명사에 대해 클래스 태깅을 수행하는 단계;를 포함하는 것을 특징으로 하는 유사문장 검색방법
|
8 |
8
제6 항에 있어서,상기 문장 추출단계는,상기 언어처리가 수행된 문장과 후보 말뭉치들에 대해 유사도를 계산하는 단계;상기 후보 말뭉치들 중 계산된 유사도가 일정값 이상인 문장을 추출하는 단계; 및상기 추출된 문장의 클래스에 대해 상기 입력된 문장의 클래스로 복원하는 단계;를 포함하는 것을 특징으로 하는 유사문장 검색방법
|
9 |
9
제6 항에 있어서,상기 순위 결정단계는,계산된 유사도의 확률과 추출된 문장의 빈도, n-gram 확률값, 입력된 문장의 n-gram, 추출된 문장의 n-gram의 유사도 중 적어도 하나에 기초하여 추출된 문장들의 순위를 결정하는 것을 특징으로 하는 유사문장 검색방법
|
10 |
10
삭제
|