맞춤기술찾기

이전대상기술

교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치 및 방법

  • 기술번호 : KST2015227757
  • 담당센터 : 부산기술혁신센터
  • 전화번호 : 051-606-6561
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 문맥 철자오류(context-sensitive spelling error) 교정을 위하여 미리 구축한 교정 어휘 쌍의 각 어휘와 주변 문맥에 나타난 어휘 간 출현빈도에 바탕을 둔 통계적 언어모형을 이용하여 문맥 철자오류 교정의 정확도와 재현율 모두를 일정 수준 이상으로 유지할 수 있도록 한 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치 및 방법에 관한 것으로, 문맥 철자오류를 검색하고 교정하기 위한 문장을 입력하는 입력부;입력된 문장에 대하여 형태소 분석 사전에 기반을 두고 어절을 형태소 단위로 분리해내는 형태소 분석을 수행하는 형태소 분석부;상기 형태소 분석부에서 분석된 형태소 중 형태소 중의성이 발생하면 형태소 중의성 제거를 하는 품사 태깅부;해당 어휘와 주변 문맥에 나타난 어휘 간 연관성을 조건부 확률과 신뢰도를 이용하여 정량화하는 연관성 분석부;상기 연관성 분석부에서 도출한 수치를 이용하여 철자오류 여부를 판단하고 철자오류를 교정하는 철자오류 교정부;를 포함하는 것이다.
Int. CL G06F 17/18 (2006.01) G06F 17/27 (2006.01)
CPC G06F 17/273(2013.01) G06F 17/273(2013.01) G06F 17/273(2013.01)
출원번호/일자 1020130081911 (2013.07.12)
출원인 부산대학교 산학협력단
등록번호/일자 10-1495240-0000 (2015.02.13)
공개번호/일자 10-2015-0007647 (2015.01.21) 문서열기
공고번호/일자 (20150225) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.07.12)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 부산대학교 산학협력단 대한민국 부산광역시 금정구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 권혁철 대한민국 부산 금정구
2 윤애선 대한민국 부산 금정구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 정기택 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)
2 오위환 대한민국 서울특별시 서초구 강남대로**길 **, *층 (반포동, 새로나빌딩)(스카이특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 부산대학교 산학협력단 대한민국 부산광역시 금정구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2013.07.12 수리 (Accepted) 1-1-2013-0627267-08
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2014.01.02 수리 (Accepted) 4-1-2014-0000027-56
3 의견제출통지서
Notification of reason for refusal
2014.08.25 발송처리완료 (Completion of Transmission) 9-5-2014-0576694-86
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2014.10.22 수리 (Accepted) 1-1-2014-1009602-30
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2014.10.22 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2014-1009640-65
6 등록결정서
Decision to grant
2015.02.05 발송처리완료 (Completion of Transmission) 9-5-2015-0087460-18
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.01.13 수리 (Accepted) 4-1-2016-5004891-78
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.09 수리 (Accepted) 4-1-2017-5004005-98
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.01.10 수리 (Accepted) 4-1-2017-5004797-18
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
문맥 철자오류를 검색하고 교정하기 위한 문장을 입력하는 입력부;입력된 문장에 대하여 형태소 분석 사전에 기반을 두고 어절을 형태소 단위로 분리해내는 형태소 분석을 수행하는 형태소 분석부;상기 형태소 분석부에서 분석된 형태소 중 형태소 중의성이 발생하면 형태소 중의성 제거를 하는 품사 태깅부;해당 어휘와 주변 문맥에 나타난 어휘 간 연관성을 조건부 확률과 신뢰도를 이용하여 정량화하는 연관성 분석부;상기 연관성 분석부에서 도출한 수치를 이용하여 철자오류 여부를 판단하고 철자오류를 교정하고, 교정 어휘 쌍을 이용한 문맥 철자오류 교정 과정에서 오타율에 기반을 둔 신뢰도를 변화시켜 교정의 정확도와 재현율을 조절하는 철자오류 교정부;를 포함하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치
2 2
제 1 항에 있어서, 상기 철자오류 교정부는,교정 어휘 쌍을 이용한 문맥 철자오류 교정 과정에서 교정 어휘 쌍의 각 어휘와 주변 문맥에 나타난 어휘 간 조건부 확률값과 오타율에 기반을 둔 신뢰도의 곱을 이용하여 문맥 철자오류 교정을 수행하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치
3 3
삭제
4 4
제 1 항에 있어서, 상기 연관성 분석부는,조건부 확률값을 구할 때, 교정 어휘 쌍의 각 어휘와 주변 문맥에 나타난 어휘 간 의미 연관성이 일정값을 넘지 않을 때는 해당 어휘는 제외하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치
5 5
제 1 항에 있어서, 상기 연관성 분석부는,조건부 확률값을 구할 때, 주변 문맥에 나타나는 어휘를 교정 어휘 쌍의 각 어휘가 발생한 위치를 기준으로 윈도우 크기(window size)를 이용하여 선별하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치
6 6
제 5 항에 있어서, 상기 연관성 분석부는,윈도우 크기(window size)를 고정하지 않고 동적으로 구하면서 주변 문맥에 나타나는 어휘를 선별하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 장치
7 7
문맥 철자오류를 검색하고 교정하기 위한 문장을 입력하는 단계;입력된 문장에 대하여 형태소 분석 사전에 기반을 두고 어절을 형태소 단위로 분리해내는 형태소 분석을 수행하는 단계;분석된 형태소 중 형태소 중의성이 발생하면 형태소 중의성 제거를 하는 단계;해당 어휘와 주변 문맥에 나타난 어휘 간 연관성을 조건부 확률과 신뢰도를 이용하여 정량화하는 단계;정량화하여 도출한 수치를 이용하여 철자오류 여부를 판단하고 철자오류를 교정하고, 교정 어휘 쌍을 이용한 문맥 철자오류 교정 과정에서 오타율에 기반을 둔 신뢰도를 변화시켜 교정의 정확도와 재현율을 조절하는 단계;를 포함하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법
8 8
제 7 항에 있어서, 상기 해당 어휘와 주변 문맥에 나타난 어휘 간 연관성을 조건부 확률과 신뢰도를 이용하여 정량화하는 단계에서,나이브베이즈(naive bayes)를 이용하여 '교정 어휘 쌍' 중 문맥에 해당하는 어휘를 선택하는 방법을 수식화하면,이고, TW(target words)는 교정 어휘 쌍, tw1과 tw2는 편집거리 1에 해당하는 어휘, CW(context words)는 교정 어휘 쌍과 함께 나타나는 문맥 정보이고, 나이브베이즈에 의해 사후 확률(posterior probability) P(CW|TW)는 tw와 CW 간 조건부 확률로 계산하고, 사전 확률(prior probability) P(TW)는 TW의 발생빈도로 계산하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법
9 9
제 8 항에 있어서, 상기 사전 확률을 오타 발생률로 보고 수식을 정리하면,CR(credibility reliability)은 어휘의 신뢰도이고, 교정 어휘 쌍의 어휘 중 문맥 철자오류 발생 여부를 검사하는 문맥에 나타난 대상어에는 CR의 신뢰도를 대치어에는 1-CR의 신뢰도롤 부여하고, 나이브베이즈에서와 같이 사후 확률(posterior probability) P(CW|TW)는 tw와 CW 간 조건부 확률로 계산하는 것을 특징으로 하는 교정 어휘 쌍을 이용한 통계적 문맥 철자오류 교정 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 교육부 부산대학교 산학협력단 중견연구자지원사업(핵심연구_공동연구) 극한 언어 사용 환경에 적응적인 한국어 문서 교정 플랫폼 개발