맞춤기술찾기

이전대상기술

문장 띄어쓰기 시스템 및 방법

  • 기술번호 : KST2015177764
  • 담당센터 :
  • 전화번호 :
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 문장의 자동 띄어쓰기 기술에 관한 것으로, 특히 컴퓨팅 파워가 낮은 휴대 단말 기기에서 입력된 문장의 띄어쓰기 부분을 자동으로 인식하여 적용할 수 있는 문장 띄어쓰기 시스템 및 방법에 관한 것이다. 이를 위해 본 발명은 정답 말뭉치로부터 자질별로 확률 값이 설정되는 확률 값 정보를 생성하는 단계와, 상기 확률 값 정보를 실제 적용한 결과물로부터 오류 보정 규칙을 생성하는 단계로 구성되는 학습 과정, 및 사용자가 입력한 문장(이하 사용자 입력 문장)에 상기 확률 값 정보와 상기 오류 보정 규칙 집합을 순차적으로 적용하여 띄어쓰기가 보정된 사용자 입력 문장을 출력하는 적용 과정을 포함하는 문장 띄어쓰기 방법과 그 시스템을 제공한다.이에, 핸드폰이나 PDA와 같이 일반적인 PC에 비해 컴퓨팅 파워가 떨어지는 휴대 단말기 등에서 효과적으로 작동되는 경량화된 문장 자동 띄어쓰기 시스템 및 방법을 구현할 수 있다 띄어쓰기, n-gram, CRFs, 말뭉치, 휴대 단말기, 확률 모델
Int. CL G06F 17/27 (2006.01)
CPC
출원번호/일자 1020080032348 (2008.04.07)
출원인 삼성전자주식회사, 강원대학교산학협력단
등록번호/일자 10-1496885-0000 (2015.02.23)
공개번호/일자 10-2009-0106936 (2009.10.12) 문서열기
공고번호/일자 (20150227) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2013.04.03)
심사청구항수 23

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 삼성전자주식회사 대한민국 경기도 수원시 영통구
2 강원대학교산학협력단 대한민국 강원도 춘천시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 송희준 대한민국 경기도 남양주시 도농로 **, *단지
2 박영희 대한민국 서울특별시 성북구
3 심현식 대한민국 경기도 용인시 수지구
4 함종규 대한민국 서울특별시 송파구
5 김학수 대한민국 강원도 춘천시 강원대학길
6 김종환 대한민국 강원도 춘천시 강원대학길
7 송영길 대한민국 강원도 춘천시 강원대학길

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 윤동열 대한민국 서울시 금천구 가산디지털*로 *** ***호(가산동, 에이스하이엔드타워*차)(윤앤리특허법인(유한))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 강원대학교산학협력단 강원도 춘천시
2 삼성전자주식회사 경기도 수원시 영통구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.04.07 수리 (Accepted) 1-1-2008-0250972-74
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.04.15 수리 (Accepted) 4-1-2011-5075634-10
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2011.12.13 수리 (Accepted) 4-1-2011-5249875-98
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.03.08 수리 (Accepted) 4-1-2012-5049179-27
5 출원인정보변경(경정)신고서
Notification of change of applicant's information
2012.06.21 수리 (Accepted) 4-1-2012-5132663-40
6 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2013.04.03 수리 (Accepted) 1-1-2013-0291273-35
7 선행기술조사의뢰서
Request for Prior Art Search
2013.12.06 수리 (Accepted) 9-1-9999-9999999-89
8 선행기술조사보고서
Report of Prior Art Search
2014.01.10 수리 (Accepted) 9-1-2014-0002586-19
9 의견제출통지서
Notification of reason for refusal
2014.06.23 발송처리완료 (Completion of Transmission) 9-5-2014-0424337-26
10 [지정기간연장]기간연장(단축, 경과구제)신청서
[Designated Period Extension] Application of Period Extension(Reduction, Progress relief)
2014.08.20 수리 (Accepted) 1-1-2014-0787790-18
11 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2014.09.23 수리 (Accepted) 1-1-2014-0904597-69
12 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2014.09.23 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2014-0904598-15
13 등록결정서
Decision to grant
2015.02.05 발송처리완료 (Completion of Transmission) 9-5-2015-0087458-15
14 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.11.05 수리 (Accepted) 4-1-2019-5230938-29
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
정답 말뭉치와 상기 정답 말뭉치를 모두 붙여 쓴 오류 말뭉치를 획득하는 단계와, 상기 정답 말뭉치로부터 자질들을 추출하여 확률 값 정보를 생성하는 단계와, 상기 확률 값 정보를 상기 오류 말뭉치에 적용한 결과물로부터 오류 보정 규칙을 생성하는 단계로 구성되는 학습 과정과,사용자가 입력한 문장(이하 사용자 입력 문장)에 상기 확률 값 정보와 상기 오류 보정 규칙 집합을 순차적으로 적용하여 띄어쓰기가 보정된 사용자 입력 문장을 출력하는 적용 과정을 포함하며,상기 오류 보정 규칙을 생성하는 단계는,상기 오류 말뭉치에 상기 확률 값 정보와 확률 모델을 적용하여 1차 띄어쓰기 말뭉치를 생성하는 1차 띄어쓰기 단계와,상기 1차 띄어쓰기 말뭉치로부터 보정이 필요한 지점을 추출하여 후보 규칙들을 생성하는 후보 규칙 생성 단계와, 각각의 상기 후보 규칙에 대한 신뢰 점수를 산출하고, 산출된 상기 신뢰 점수를 기반으로 하여 상기 후보 규칙들 중 상기 오류 보정 규칙을 선택하는 규칙 선택 단계를 포함하는 것을 특징으로 하는 문장 띄어쓰기 방법
2 2
제 1 항에 있어서, 상기 확률 값 정보를 생성하는 단계는 상기 추출한 자질들을 저장하는 단계와, 상기 오류 말뭉치에 상기 추출된 자질들과 확률 모델을 적용하여 상기 확률 값 정보를 생성하는 확률 값 정보 생성 단계를 포함하는 것을 특징으로 하는 문장 띄어쓰기 방법
3 3
제 2 항에 있어서, 상기 자질 추출 단계는, 상기 정답 말뭉치에서 1-gram(uni-gram)으로 자질을 추출하는 것을 특징으로 하는 문장 띄어쓰기 방법
4 4
제 3 항에 있어서, 상기 자질 추출 단계는,띄어쓰기 지점에서 앞 3음절과 뒤 2음절로 이루어지는 5음절로 자질을 추출 하는 단계인 것을 특징으로 하는 문장 띄어쓰기 방법
5 5
제 3 항에 있어서, 상기 자질 추출 단계는,숫자, 특수 기호, 외래 문자를 포함하는 특수 문자는 일반화된 문자로 정의하며 추출하는 단계인 것을 특징으로 하는 문장 띄어쓰기 방법
6 6
제 3 항에 있어서, 상기 확률 값 정보 생성부는, CRFs(Conditional Random Fields) 확률 모델을 이용하여 상기 확률 값 정보를 생성하는 것을 특징으로 하는 문장 띄어쓰기 방법
7 7
제 6 항에 있어서, 상기 확률 값 정보 생성 단계는 수학식 1을 상기 확률 모델로 이용하는 것을 특징으로 하는 문장 띄어쓰기 방법
8 8
삭제
9 9
제 1 항에 있어서, 상기 후보 규칙 생성 단계는,2-gram 이상으로 상기 후보 규칙들을 생성하는 단계인 것을 특징으로 하는 문장 띄어쓰기 방법
10 10
제 1 항에 있어서, 상기 규칙 선택 단계는,상기 후보 규칙들과, 상기 정답 말뭉치를 비교하여 각각의 상기 후보 규칙에 대한 상기 신뢰 점수를 산출하는 단계를 포함하는 것을 특징으로 하는 문장 띄어쓰기 방법
11 11
제 10 항에 있어서, 상기 규칙 선택 단계는 수학식 2, 수학식 3을 이용하여 상기 신뢰 점수를 산출하는 것을 특징으로 하는 문장 띄어쓰기 방법
12 12
제 11 항에 있어서, 상기 규칙 선택 단계는,상기 신뢰 점수가 1
13 13
제 1 항에 있어서, 상기 적용 과정은, 상기 사용자 입력 문장을 입력 받는 단계와,상기 사용자 입력 문장에 상기 확률 값 정보의 확률 값을 적용하며 1차 띄어쓰기 문장을 생성하는 단계와,상기 1차 띄어쓰기 문장에 상기 오류 보정 규칙을 적용하여 2차 띄어쓰기 문장을 생성하는 단계를 포함하는 것을 특징으로 하는 문장 띄어쓰기 방법
14 14
제 13 항에 있어서, 상기 1차 띄어쓰기 문장을 생성하는 단계는,상기 사용자 입력 문장으로부터 uni-gram으로 자질을 추출하는 단계와,상기 추출된 자질에 대응하는 상기 확률 값을 기반으로 하여 띄어쓰기 여부를 판단하고, 판단 결과에 따라 띄어쓰기를 수행하는 단계를 포함하는 것을 특징으로 하는 문장 띄어쓰기 방법
15 15
제 13 항에 있어서, 상기 2차 띄어쓰기 문장을 생성하는 단계는, 보정이 필요한 지점에 대해, 대응하는 상기 오류 보정 규칙들 중 상기 신뢰 점수가 가장 큰 오류 보정 규칙만을 적용하는 단계인 것을 특징으로 하는 문장 띄어쓰기 방법
16 16
정답 말뭉치와 상기 정답 말뭉치를 모두 붙여 쓴 오류 말뭉치를 획득하고, 상기 정답 말뭉치로부터 자질들을 추출하여 확률 값 정보를 생성하는 상기 확률 값 정보 생성부와, 상기 확률 값 정보를 상기 오류 말뭉치에 적용한 결과물로부터 오류 보정 규칙을 생성하는 보정 규칙 생성부를 포함하는 학습부; 및사용자가 입력한 문장(이하 사용자 입력 문장)에 상기 확률 값 정보와 상기 오류 보정 규칙 집합을 순차적으로 적용하여 띄어쓰기가 보정된 상기 사용자 입력 문장을 출력하는 적용부;를 포함하며,상기 보정 규칙 생성부는, 오류 말뭉치에 상기 확률 값 정보와 확률 모델을 적용하여 1차 띄어쓰기 말뭉치를 생성하고, 상기 1차 띄어쓰기 말뭉치로부터 보정이 필요한 지점을 추출하여 후보 규칙들을 생성하고, 각각의 상기 후보 규칙에 대한 신뢰 점수를 산출하여 산출된 상기 신뢰 점수를 기반으로 하여 상기 후보 규칙들 중 상기 오류 보정 규칙을 생성 및 저장하는 것을 특징으로 하는 문장 띄어쓰기 시스템
17 17
제 16 항에 있어서, 상기 확률 값 정보 생성부는,상기 정답 말뭉치로부터 추출한 자질들을 저장하고, 상기 오류 말뭉치에 상기 추출된 자질들과 확률 모델을 적용하여 상기 확률 값 정보를 생성 및 저장하는 것을 특징으로 하는 문장 띄어쓰기 시스템
18 18
제 16 항에 있어서, 상기 확률 값 정보 생성부는, 상기 정답 말뭉치에서 1-gram(uni-gram)으로 자질을 추출하는 것을 특징으로 하는 문장 띄어쓰기 시스템
19 19
제 17 항에 있어서, 상기 확률 값 정보 생성부는, CRFs(Conditional Random Fields) 확률 모델을 이용하여 상기 확률 값 정보를 생성하는 것을 특징으로 하는 문장 띄어쓰기 시스템
20 20
삭제
21 21
제 16 항에 있어서, 상기 보정 규칙 생성부는,상기 후보 규칙들과, 상기 정답 말뭉치를 비교하여 각각의 상기 후보 규칙에 대한 상기 신뢰 점수를 산출하는 것을 특징으로 하는 문장 띄어쓰기 시스템
22 22
제 16 항에 있어서, 상기 적용부는,상기 확률 값 정보를 상기 사용자 입력 문장에 적용하여 1차 띄어쓰기 문장을 생성하는 1차 적용부;상기 1차 띄어쓰기 문장에 상기 오류 보정 규칙을 적용하여 보정된 사용자 입력 문장을 생성하는 2차 적용부;를 포함하여 구성되는 것을 특징으로 하는 문장 띄어쓰기 시스템
23 23
제 22 항에 있어서, 상기 1차 적용부는, 상기 사용자 입력 문장으로부터 uni-gram으로 자질을 추출하고, 상기 추출된 자질에 대응하는 상기 확률 값 정보를 기반으로 하여 띄어쓰기 여부를 판단하며, 판단 결과에 따라 띄어쓰기를 수행하는 것을 특징으로 하는 문장 띄어쓰기 시스템
24 24
제 22 항에 있어서, 상기 2차 적용부는, 상기 1차 띄어쓰기 문장 중 보정이 필요한 지점에 대해, 대응하는 상기 오류 보정 규칙들 중 상기 신뢰 점수가 가장 큰 오류 보정 규칙만을 적용하는 것을 특징으로 하는 문장 띄어쓰기 시스템
25 25
제 22 항에 있어서, 상기 확률 값 정보 및 상기 오류 보정 규칙들이 저장되는 저장부를 더 포함하는 것을 특징으로 하는 문장 띄어쓰기 시스템
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US08234232 US 미국 FAMILY
2 US20090254501 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2009254501 US 미국 DOCDBFAMILY
2 US8234232 US 미국 DOCDBFAMILY
국가 R&D 정보가 없습니다.