맞춤기술찾기

이전대상기술

철자 오류 보정 시스템 및 방법

  • 기술번호 : KST2015178166
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 철자 오류 보정 기술에 관한 것으로, 특히 컴퓨팅 파워가 낮은 휴대 단말기에서 입력된 문장의 철자 오류를 자동으로 인식하여 보정할 수 있는 철자오류 보정 시스템 및 방법에 관한 것이다. 이를 위해 본 발명은 공인된 말뭉치로부터 철자 오류 보정 사전을 구축하고, 철자 오류 보정 사전에 등록된 문자열들 중 확인 대상 문자열을 선정하며, 확인 대상 문자열에 대응하여 문맥 정보를 획득하여 저장하는 학습 과정과, 사용자 입력 문장이 수신되면 철자 오류 보정 사전을 통해 보정 대상 문자열을 추출하고, 보정 대상 문자열이 상기 확인 대상 문자열이면, 대응하는 상기 문맥 정보를 이용하여 사용자 입력 문장을 보정하는 적용 과정을 포함하는 철자 오류 보정 방법과 그 시스템을 제공한다.이에, 본 핸드폰이나 PDA와 같이 일반적인 PC에 비해 컴퓨팅 파워가 떨어지는 휴대 단말기 등에서 효과적으로 작동되는 경량화된 철자 오류 보정 시스템 및 방법을 구현할 수 있다 철자 오류, 확률 값, 말뭉치, 휴대 단말기, 트라이 구조, 문맥 정보
Int. CL G06F 17/27 (2006.01)
CPC
출원번호/일자 1020080032349 (2008.04.07)
출원인 삼성전자주식회사, 강원대학교산학협력단
등록번호/일자 10-1491581-0000 (2015.02.03)
공개번호/일자 10-2009-0106937 (2009.10.12) 문서열기
공고번호/일자 (20150224) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.04.03)
심사청구항수 25

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 삼성전자주식회사 대한민국 경기도 수원시 영통구
2 강원대학교산학협력단 대한민국 강원도 춘천시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 송희준 대한민국 경기도 남양주시 도농로 **, *단지
2 박영희 대한민국 서울특별시 성북구
3 심현식 대한민국 경기도 용인시 수지구
4 함종규 대한민국 서울특별시 송파구
5 김학수 대한민국 강원도 춘천시 강원대학길
6 이주호 대한민국 강원도 춘천시 강원대학길
7 이세희 대한민국 강원도 춘천시 강원대학길

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤동열 대한민국 서울시 금천구 가산디지털*로 *** ***호(가산동, 에이스하이엔드타워*차)(윤앤리특허법인(유한))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 삼성전자주식회사 대한민국 경기도 수원시 영통구
2 강원대학교산학협력단 대한민국 강원도 춘천시
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.04.07 수리 (Accepted) 1-1-2008-0250973-19
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.04.15 수리 (Accepted) 4-1-2011-5075634-10
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.13 수리 (Accepted) 4-1-2011-5249875-98
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.03.08 수리 (Accepted) 4-1-2012-5049179-27
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.06.21 수리 (Accepted) 4-1-2012-5132663-40
6 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2013.04.03 수리 (Accepted) 1-1-2013-0291189-08
7 선행기술조사의뢰서
Request for Prior Art Search
2013.12.24 수리 (Accepted) 9-1-9999-9999999-89
8 선행기술조사보고서
Report of Prior Art Search
2014.02.11 수리 (Accepted) 9-1-2014-0013294-39
9 의견제출통지서
Notification of reason for refusal
2014.06.23 발송처리완료 (Completion of Transmission) 9-5-2014-0424338-72
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2014.08.25 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2014-0806616-73
11 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2014.08.25 수리 (Accepted) 1-1-2014-0806615-27
12 등록결정서
Decision to grant
2015.01.19 발송처리완료 (Completion of Transmission) 9-5-2015-0041328-22
13 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.05 수리 (Accepted) 4-1-2019-5230938-29
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
공인된 말뭉치를 기반으로 하여 철자 오류 보정 사전을 구축하는 사전 구축 단계와, 상기 철자 오류 보정 사전에 등록된 문자열들 중 문맥에 따라 다르게 사용될 수 있는 문자열들(이하, 확인 대상 문자열)을 선정하고, 상기 확인 대상 문자열에 대응하여 문맥 정보를 획득하여 저장하는 정보 저장 단계를 포함하는 학습 과정과,사용자가 입력한 문장(이하 사용자 입력 문장)이 수신되면, 상기 철자 오류 보정 사전을 통해 보정 대상 문자열을 추출하는 추출 단계와, 상기 보정 대상 문자열이 상기 확인 대상 문자열이면, 대응하는 상기 문맥 정보를 이용하여 상기 사용자 입력 문장을 보정하는 보정 단계를 포함하는 적용 과정을 포함하고,상기 문맥 정보는, 문자열의 전 또는 후 중 적어도 하나에 위치한 글자의 출현 빈도수를 이용하여 생성되는 것을 특징으로 하는 철자 오류 보정 방법
2 2
제 1 항에 있어서, 상기 적용 과정은,상기 사용자 입력 문장을 보정한 후, 보정된 문자열에 대응하여 조사를 보정하는 조사 보정 단계를 더 포함하는 것을 특징으로 하는 철자 오류 보정 방법
3 3
제 2 항에 있어서, 상기 공인된 말뭉치는,기 발간된 어휘집, 단어집, 및 사전을 포함하는 것을 특징으로 하는 철자 오류 보정 방법
4 4
제 2 항에 있어서, 상기 철자 오류 보정 사전은,오류 문자열이 등록되는 오류 문자열 필드와, 상기 오류 문자열을 보정한 보정 문자열이 등록되는 보정 문자열 필드, 및 상기 오류 문자열 또는 상기 보정 문자열의 품사가 등록되는 품사 필드를 포함하여 구성되는 것을 특징으로 하는 철자 오류 보정 방법
5 5
제 4 항에 있어서, 상기 사전 구축 단계는, 구축된 상기 철자 오류 보정 사전을 음절 트라이(TRIE) 또는 자소 트라이 형태로 변환하여 메모리에 적재하는 단계를 더 포함하는 것을 특징으로 하는 철자 오류 보정 방법
6 6
제 5 항에 있어서, 상기 정보 저장 단계는, 학습 말뭉치와 상기 철자 오류 보정 사전을 비교하며 상기 확인 대상 문자열을 선정하는 문자열 선정 단계와, 상기 학습 말뭉치에서 상기 확인 대상 문자열에 대응하는 문맥 정보를 획득하여 저장하는 정보 획득 단계를 포함하는 것을 특징으로 하는 철자 오류 보정 방법
7 7
제 6 항에 있어서, 상기 문자열 선정 단계는,상기 오류 문자열 필드에 등록된 문자열이 상기 학습 말뭉치에 1회 이상 포함된 경우, 해당 오류 문자열을 상기 확인 대상 문자열로 선정하는 단계인 것을 특징으로 하는 철자 오류 보정 방법
8 8
제 6 항에 있어서, 상기 정보 획득 단계는,상기 확인 대상 문자열에 대응하는 상기 오류 문자열과 상기 보정 문자열의 문맥 정보를 모두 추출하는 단계인 것을 특징으로 하는 철자 오류 보정 방법
9 9
제 8 항에 있어서, 상기 문맥 정보는 상기 학습말뭉치 내에서,상기 확인 대상 문자열 Wbefore가 출현한 빈도수 f(Wbefore), w-1Wallw+1라는 문자열이 출현한 빈도수 f(w-1,Wall,w+1), w-1Wall이라는 문자열이 출현한 빈도수 f(w-1,Wall), Wallw+1이라는 문자열이 출현한 빈도수 f(Wall,w+1), c-1과 c+1 이라는 범주 사이에 Wall이 출현한 빈도수 f(c-1,Wall,c+1), c-1이라는 범주 다음에 Wall이 출현한 빈도수 f(c-1,Wall), c+1이라는 범주 이전에 Wall이 출현한 빈도수 f(Wall,c+1)를 포함하여 구성되며, 상기 Wall은 상기 확인 대상 문자열의 오류 문자열 Wbefore와, 그의 보정 문자열 Wafter를 의미하고, 상기 w-1은 상기 Wall 바로 이전의 음절을, 상기 w+1은 상기 Wall 바로 다음의 음절을, 상기 c-1은 상기 Wall 바로 이전 문자열이 속한 범주를, 상기 c+1은 상기 Wall 바로 다음 문자열이 속한 범주를 나타내는 것을 특징으로 하는 철자 오류 보정 방법
10 10
제 9 항에 있어서, 상기 범주는, 언어의 종류, 숫자, 특수 문자, 보조용언, 접미사, 어미, 및 기타를 포함하여 구성되는 것을 특징으로 하는 철자 오류 보정 방법
11 11
제 9 항에 있어서, 상기 보정 단계는, 상기 보정 대상 문자열이 상기 확인 대상 문자열에 포함되면, 상기 확인 대상 문자열에 대응하는 문맥 정보를 이용하여 상기 확인 대상 문자열의 문맥 점수를 산출하는 점수 산출 단계, 및 산출된 상기 문맥 점수에 따라 문자열을 선택하여 상기 보정 대상 문자열을 보정하는 문장 보정 단계를 포함하는 것을 특징으로 하는 철자 오류 보정 방법
12 12
제 11 항에 있어서, 상기 점수 산출 단계는, 다음의 수학식을 통해 상기 확인 대상 문자열에 대응하는 상기 오류 문자열과 상기 보정 문자열의 문맥 점수 P(Wbefore | w-1, Wall, w+1)를 각각 산출하는 단계인 것을 특징으로 하는 철자 오류 보정 방법
13 13
제 2 항에 있어서, 상기 조사 보정 단계는, 상기 문장 보정 단계에서 보정된 문자열이 체언인지 확인하는 1 단계와,체언이면, 해당 문자열에 대응하는 상기 오류 문자열과 상기 보정 문자열의 마지막 음절의 종성을 확인하는 2 단계, 및확인 결과에 대응하여 상기 보정된 문자열의 조사를 보정하는 3 단계를 포함하는 것을 특징으로 하는 철자 오류 보정 방법
14 14
제 13 항에 있어서, 상기 3 단계는, 상기 보정된 문자열에 대응하는 조사를 선정하는 단계,상기 선정된 조사에 대응하는 후보 조사를 추출하는 단계, 상기 선정된 조사와 상기 후보 조사의 문맥 점수를 산출하는 단계, 및상기 문맥 점수에 대응하여 상기 선정된 조사와 상기 후보 조사 중 어느 하나를 선택하여 상기 보정된 문자열에 적용하는 단계를 포함하는 것을 특징으로 하는 철자 오류 보정 방법
15 15
공인된 말뭉치를 기반으로 하여 철자 오류 보정 사전을 구축하는 사전 구축부, 상기 철자 오류 보정 사전에 등록된 문자열들 중 문맥에 따라 다르게 사용될 수 있는 문자열들(이하, 확인 대상 문자열)을 추출하고, 상기 확인 대상 문자열의 문맥 정보를 추출하여 저장하는 정보 추출부를 포함하여 구성되는 학습부; 및사용자가 입력한 문장(이하 사용자 입력 문장)에 대응하여 상기 철자 오류 보정 사전을 통해 보정 대상 문자열을 추출하고, 상기 보정 대상 문자열이 상기 확인 대상 문자열이면, 대응하는 상기 문맥 정보를 이용하여 상기 사용자 입력 문장을 보정하는 문자열 보정부,상기 문자열 보정부를 통해 보정된 상기 사용자 입력 문장에서 보정된 문자열에 대응하여 조사를 보정하는 조사 보정부를 포함하여 구성되는 적용부;를 포함하고,상기 문맥 정보는, 상기 보정 대상 문자열의 전 또는 후 중 적어도 하나에 위치한 글자의 출현 빈도수를 이용하여 생성되는 것을 특징으로 하는 철자 오류 보정 시스템
16 16
제 15 항에 있어서, 상기 철자 오류 보정 사전은,오류 문자열이 등록되는 오류 문자열 필드와, 상기 오류 문자열을 보정한 보정 문자열이 등록되는 보정 문자열 필드, 및 상기 오류 문자열 또는 상기 보정 문자열의 품사가 등록되는 품사 필드를 포함하여 구성되는 것을 특징으로 하는 철자 오류 보정 시스템
17 17
제 16 항에 있어서, 상기 사전 구축부는, 구축된 상기 철자 오류 보정 사전을 음절 트라이(TRIE) 또는 자소 트라이 형태로 변환하여 메모리에 적재하는 것을 특징으로 하는 철자 오류 보정 시스템
18 18
제 16 항에 있어서, 상기 정보 추출부는, 학습 말뭉치와 상기 철자 오류 보정 사전을 비교하며 상기 확인 대상 문자열을 추출하는 것을 특징으로 하는 철자 오류 보정 시스템
19 19
제 18 항에 있어서, 상기 정보 추출부는, 상기 오류 문자열 필드에 등록된 문자열이 상기 학습 말뭉치에 1회 이상 포함된 경우, 해당 오류 문자열을 상기 확인 대상 문자열로 추출하는 것을 특징으로 하는 철자 오류 보정 시스템
20 20
제 18 항에 있어서, 상기 정보 추출부는, 상기 확인 대상 문자열에 대응하는 상기 오류 문자열과 상기 보정 문자열의 문맥 정보를 모두 추출하는 것을 특징으로 하는 철자 오류 보정 시스템
21 21
제 20 항에 있어서, 상기 문자열 보정부는, 상기 사용자 입력 문장 내에 상기 확인 대상 문자열이 포함되어 있으면, 해당하는 상기 확인 대상 문자열 및 대응하는 보정 문자열의 문맥 정보를 이용하여 문맥 점수를 산출하고, 산출된 상기 문맥 점수에 따라 문자열을 선택하여 상기 보정 대상 문자열을 보정하는 것을 특징으로 하는 철자 오류 보정 시스템
22 22
제 21 항에 있어서, 상기 문맥 정보는 상기 학습말뭉치 내에서,상기 확인 대상 문자열 Wbefore가 출현한 빈도수 f(Wbefore), w-1Wallw+1라는 문자열이 출현한 빈도수 f(w-1,Wall,w+1), w-1Wall이라는 문자열이 출현한 빈도수 f(w-1,Wall), Wallw+1이라는 문자열이 출현한 빈도수 f(Wall,w+1), c-1과 c+1 이라는 범주 사이에 Wall이 출현한 빈도수 f(c-1,Wall,c+1), c-1이라는 범주 다음에 Wall이 출현한 빈도수 f(c-1,Wall), c+1이라는 범주 이전에 Wall이 출현한 빈도수 f(Wall,c+1)를 포함하여 구성되며, 상기 Wall은 상기 확인 대상 문자열의 오류 문자열 Wbefore와, 그의 보정 문자열 Wafter를 의미하고, 상기 w-1은 상기 Wall 바로 이전의 음절을, 상기 w+1은 상기 Wall 바로 다음의 음절을, 상기 c-1은 상기 Wall 바로 이전 문자열이 속한 범주를, 상기 c+1은 상기 Wall 바로 다음 문자열이 속한 범주를 나타내는 것을 특징으로 하는 철자 오류 보정 시스템
23 23
제 22 항에 있어서, 상기 문자열 보정부는, 다음의 수학식을 통해 상기 문맥 점수 P(Wbefore | w-1, Wall, w+1)를 산출하는 것을 특징으로 하는 철자 오류 보정 시스템
24 24
제 15 항에 있어서, 상기 조사 보정부는,상기 보정된 문자열이 체언이면 조사의 보정 여부를 확인하고, 확인 결과에 대응하여 상기 보정된 문자열에 따른 조사를 선정하여 상기 선정된 조사에 대응하는 후보 조사를 추출하며, 상기 선정된 조사와 상기 후보 조사의 문맥 점수를 산출하여 산출된 상기 문맥 점수에 따라 상기 선정된 조사와 상기 후보 조사 중 어느 하나로 상기 보정된 문자열을 보정하는 것을 특징으로 하는 철자 오류 보정 시스템
25 25
제 21 항에 있어서, 상기 철자 오류 보정 사전 및 상기 문맥 정보들이 저장되는 저장부를 더 포함하는 것을 특징으로 하는 철자 오류 보정 시스템
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US08365070 US 미국 FAMILY
2 US20090254819 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009254819 US 미국 DOCDBFAMILY
2 US8365070 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.