1 |
1
오류 문서를 생성하기 위한 올바른 문서를 입력하는 입력부;상기 입력부를 통해 입력된 문서 전체 문장의 어절을 순차적으로 검사하며 어절에 오류가 나타날 수 있는지를 검사하여 해당 위치에 주변 문맥과 함께 나타나는 후보어를 찾는 오류 대상 어절 검사부;오류 대상 어절 검사부에서 찾아진 단어와 정답어와의 편집거리 및 문자의 키보드 입력 오류 범주를 기준으로 필터링하여 오류어 후보들을 선별하는 오류어 후보 선별부;오류어 후보와 주변 문맥의 확률을 계산하여 1순위의 오류어를 최종 오류어로 결정하는 오류어 결정 및 제시부;를 포함하는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
2 |
2
제 1 항에 있어서, 오류 대상 어절 검사부는,N-gram의 정보를 이용해서 오류어 생성을 위한 중심 단어 위치에 있는 주변 문맥과 공기하는 모든 단어를 찾는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
3 |
3
제 1 항에 있어서, 오류 대상 어절 검사부는,을 이용하여 후보어를 미리 구축된 N-gram 사전을 통해 찾고,중심어() 위치 "*"를 기준으로 양쪽 어절(주변 어절 : ) 범위의 N-gram을 검색하며, 검색은 중심어 위치인 "*"의 주변 문맥 단어와 동시 출현하는 모든 통계 후보 단어를 찾는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
4 |
4
제 1 항에 있어서, 오류어 후보 선별부는,주변 문맥과 공기하는 모든 후보어의 집합을 이용해서 오류어 필터(filter)를 이용해서 오류 후보어를 선별하는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
5 |
5
제 4 항에 있어서, 오류어 필터는 키보드 입력 알파벳에 해당하는 근접키의 거리와 중심어와 후보어의 편집 거리(edit distance)를 기준으로 계산하는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
6 |
6
제 1 항에 있어서, 키보드 입력 오류 범주는,문자의 누락, 문자의 추가, 문자의 반복 입력, 단어에서 반복되는 문자의 누락, 문자를 다른 문자로 잘 못 입력, 단어에서 인접한 두 문자의 순서를 반대로 입력, 앞의 모든 입력 오류가 복합적으로 일어나는 경우를 포함하고,키보드 상에서 목표 입력 문자의 주변 키보드 문자를 대상으로 오류 입력을 판단하는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
7 |
7
제 1 항에 있어서, 오류어 결정 및 제시부는,노이지 채널모형을 이용해 정답 단어와 오류 후보어의 문맥 확률의 관계를 파악하고 정답 단어의 확률을 뛰어 넘지 않는 선에서의 후보어를 오류어로 선택하고,으로 계산하고,출력 데이터의 확률 는 상수이고, 언어모형(language model)인 와 채널확률(channel probability)인 의 확률 분포를 갖는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
8 |
8
제 7 항에 있어서, 언어모형 를 사용자가 입력하려고 하는 문자열의 확률분포로 정의하며, 채널확률 를 철자오류의 발생률로 정의하여 후보어와 문맥이 이루는 확률을 계산하여 근삿값 를 얻는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템
|
9 |
9
오류 문서의 생성을 위한 올바른 문서를 입력하고, 문서 문장의 어절을 순차적으로 검사를 하는 단계;어절에 오류 후보어가 나타나는지를 판단하여 어절에 후보어가 존재한다면 해당 어절을 오류 생성 어절로 결정하는 단계;후보어들 중에서 오류 후보어로 필터링을 하여, 키보드 입력과정에서와 편집거리를 고려하여 결정하는 단계;필터링된 오류 후보어들은 중심 어절의 위치에서의 주변 문맥과의 확률을 계산하며, 확률을 비교하여 1 순위에 해당하는 오류어 또는 오류 후보어 중에서 임의적인 선택을 통해 오류를 문서에 반영하는 단계;를 포함하는 것을 특징으로 하는 문맥의존 철자오류 교정 테스트 문서 생성을 위한 방법
|