1 |
1
문맥 철자오류를 검색하고 교정하기 위한 문장을 입력하는 입력부;상기 입력부를 통하여 입력되는 문장을 어절 단위로 검사를 진행하는 어절 단위 검사부;상기 어절 단위 검사부를 통하여 검사가 진행된 어절의 교정 어휘 쌍을 생성하는 실시간 교정 어휘쌍 생성부;가장 확률이 높은 단어를 기준으로 오류 판단을 하는 오류 판단부;상기 오류 판단부의 판단 결과에 따라 대치어를 제시하는 대치어 제시부;를 포함하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
2 |
2
제 1 항에 있어서, 상기 실시간 교정 어휘쌍 생성부는,말뭉치에서 연속되어 나타난 세 개의 단어를 추출하여 만든 Trigram 사전을 이용하여 대상 단어 T와 같은 문맥을 가지는 단어를 찾아 대상 단어 T가 속한 교정 어휘 쌍을 생성하는 방법으로 해당 어절의 교정 어휘 쌍을 생성하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
3 |
3
제 2 항에 있어서, 상기 실시간 교정 어휘쌍 생성부는,검사 대상이 되는 어절의 좌우 2개의 어절을 기준으로 교정 어휘 쌍을 생성하여 좌우 2개의 어절을 문맥으로 가지는 단어가 교정 어휘 쌍이 되도록 하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
4 |
4
제 1 항에 있어서, 상기 대치어 제시부는,확률이 가장 높으면 해당 어절이 오류가 아닌 것으로 판단하고, 다른 어절이 확률이 더 높다면 해당 어절은 오류로 판단하고, 해당 어휘를 대치어로 제시하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
5 |
5
제 1 항에 있어서, 상기 실시간 교정 어휘쌍 생성부는,입력 단어열 와 출력 단어열 에서 노이지 채널을 지나면서 바뀐 단어가 라고 하고, 다른 단어에는 변화가 없다고 가정하면, 문맥의존 철자오류 교정은 확률 를 최대로 하는 를 선택하고,으로 정의되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
6 |
6
제 5 항에 있어서, 교정 어휘쌍은,으로 정의되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 장치
|
7 |
7
어절 단위로 검사를 진행하는 어절 판단 단계;말뭉치에서 연속되어 나타난 세 개의 단어를 추출하여 만든 Trigram 사전을 이용하여 대상 단어 T와 같은 문맥을 가지는 단어를 찾아 대상 단어 T가 속한 교정 어휘 쌍을 생성하는 방법으로 해당 어절의 교정 어휘 쌍을 먼저 생성하는 실시간 교정 어휘쌍 생성 단계;가장 확률이 높은 단어를 기준으로 오류를 판단하는 오류 판단 단계;오류 판단 단계에서의 판단 결과에 따라 대치어를 제시하는 대치어 제시 단계;를 포함하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
8 |
8
제 7 항에 있어서, 상기 실시간 교정 어휘쌍 생성 단계는,검사 대상이 되는 어절의 좌우 2개의 어절을 기준으로 교정 어휘 쌍을 생성하여 좌우 2개의 어절을 문맥으로 가지는 단어가 교정 어휘 쌍이 되도록 하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
9 |
9
제 7 항에 있어서, 상기 대치어 제시 단계는,확률이 가장 높으면 해당 어절이 오류가 아닌 것으로 판단하고, 다른 어절이 확률이 더 높다면 해당 어절은 오류로 판단하고, 해당 어휘를 대치어로 제시하는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
10 |
10
제 7 항에 있어서, 상기 실시간 교정 어휘쌍 생성 단계는,입력 단어열 와 출력 단어열 에서 노이지 채널을 지나면서 바뀐 단어가 라고 하고, 다른 단어에는 변화가 없다고 가정하면, 문맥의존 철자오류 교정은 확률 를 최대로 하는 를 선택하고,으로 정의되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
11 |
11
제 10 항에 있어서, 교정 어휘쌍은,으로 정의되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
12 |
12
제 7 항에 있어서, 실시간 교정 어휘쌍 생성 단계에서 교정 어휘 쌍 생성에 이용되는 Trigram 사전은 Trie 자료구조에 기반을 두고 구축되고,1-gram은 으로 저장되고,여기서, 은 (1-gram)의 출현빈도, 은 으로 시작하는 모든 2-gram이 저장된 저장소를 가리키고,2-gram은 → 으로 저장되고,여기서, 는 2-gram인 (, )의 개수, 은 2-gram인 (, )의 개수이고,마지막으로 세 번째 단계는 → 로 기억되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
13 |
13
제 7 항에 있어서, 한 문장에 대한 문맥의존 철자오류를 교정하기 위하여,문장의 첫 어절부터 마지막 어절까지 어절 단위의 검사를 진행하여 오류를 판단하고, 오류어가 발견되면 대치어로 교정하고,검사 대상이 되는 어절을 포함한 문장의 확률이 가장 높다면 해당 어절은 오류가 아니고, 다른 어절을 포함한 문장의 확률이 더 높다면, 검사 대상의 어절은 오류가 되고 해당 어휘가 대치어가 되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|
14 |
14
제 13 항에 있어서, 오류 판단과 교정의 과정이 순차적으로 진행되면서 이전 어절의 오류 여부에 따라 현재 어절의 교정 어휘 쌍이 동적으로 결정되는 것을 특징으로 하는 실시간 오류 후보 생성을 이용한 문맥의존 철자오류 교정 방법
|