맞춤기술찾기

이전대상기술

외래어 판별 방법

  • 기술번호 : KST2015095824
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 텍스트를 입력받아 그에 대응하는 합성 음성을 출력하는 음성합성 분야, 음성합성 데이터베이스 알고리즘 등에 적용 가능한 외래어 판별 방법에 관한 것이다. 본 발명의 외래어 판별 방법에 따르면, 입력 문장을 띄어쓰기 단위로 어절열로 변환하고, 각 어절에 대해서 형태소 분석 과정을 거쳐 미등록어를 검출하며, 해당 미등록어에 대해 한국어에서 음소 unigram, bigram, trigram, 음절 unigram의 출현 확률과 외래어에서 음소 unigram, bigram, trigram, 음절 unigram의 출현 확률을 이용하여 한국어인지 외래어인지 판별한다. 외래어 검출, 외래어 정보 검색, 외래어 음성 합성, 미등록어 검출
Int. CL G10L 13/06 (2013.01)
CPC G06F 17/2755(2013.01) G06F 17/2755(2013.01) G06F 17/2755(2013.01)
출원번호/일자 1020030071934 (2003.10.15)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2005-0036300 (2005.04.20) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2003.10.15)
심사청구항수 6

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김종진 대한민국 전라북도익
2 이영직 대한민국 대전광역시유성구
3 김상훈 대한민국 대전광역시유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2003.10.15 수리 (Accepted) 1-1-2003-0384673-08
2 의견제출통지서
Notification of reason for refusal
2005.07.18 발송처리완료 (Completion of Transmission) 9-5-2005-0338409-64
3 지정기간연장신청서
Request for Extension of Designated Period
2005.09.16 수리 (Accepted) 1-1-2005-0519531-25
4 지정기간연장신청서
Request for Extension of Designated Period
2005.10.18 수리 (Accepted) 1-1-2005-0587604-98
5 거절결정서
Decision to Refuse a Patent
2006.01.13 발송처리완료 (Completion of Transmission) 9-5-2006-0019103-95
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
(a) 텍스트 문장을 입력받아 공백 문자 단위로 분리하여 어절열을 생성하는 단계; (b) 상기 각 어절열을 형태소 단위로 분리하여 각 형태소의 품사를 결정하며, 상기 각 형태소의 형태소 분석 사전 상의 등재 여부를 분석하는 단계; (c) 상기 단계 (b)의 분석 결과를 바탕으로 어절을 구성하는 형태소들 중에서 접두사, 접미사, 어미, 조사, 조사/어미의 뒤에 붙는 활용형을 제거하는 단계; (d) 상기 단계 (c)에서 제거되고 남은 형태소 중에서 상기 형태소 분석 사전에 등재되어 있는 형태소를 제거하는 단계; (e) 상기 단계 (d)에서 제거되고 남은 형태소 중에서 외래어 사전에 이미 등재되어 있는 형태소를 제거하는 단계; 및 (f) 상기 단계 (e)에서 제거되고 남은 형태소의 각 음소의 유니그램, 바이그램 및 트리그램과, 상기 형태소의 각 음절의 유니그램 및 바이그램의 한국어에서의 출현 확률과 외국어에서의 출현 확률을 계산하고, 상기 계산된 확률을 서로 비교하여 해당 형태소의 외래어 여부를 판별하는 단계를 포함하는 외래어 판별 방법
2 2
제1항에 있어서, 상기 단계 (a)에서 공백 문자 단위는 어절 식별 문자이며, 공백, 탭, 개행 및 사용자가 정의한 어절 구별자를 포함하는 외래어 판별 방법
3 3
제1항에 있어서, 상기 단계 (b)에 의해 어절열은 형태소, 형태소의 품사 및 형태소 분석 사전 등재여부로 표현되는 외래어의 판별 방법
4 4
제1항에 있어서, 상기 단계 (e)에서 사용되는 외래어 사전은 한국어에서 자주 출현하는 외국어 목록과, 철자표기상 한국어와 유사하여 외래어이면서 한국어로 오인될 수 있는 형태소를 미리 저장하고 있는 외래어의 판별 방법
5 5
제1항에 있어서, 상기 단계 (f)는 상기 단계 (e)에서 제거되고 남은 형태소의 각 음소의 유니그램, 바이그램 및 트리그램과, 상기 형태소의 각 음절의 유니그램 및 바이그램의 한국어에서의 출현 확률과 외국어에서의 출현 확률을 아래의 수학식을 차례로 적용하여 계산하는 (상기은 음소 unigram에 대한 가중치이며, 는 음소 bigram에 대한 가중치, 은 음소 trigram에 대한 가중치, 는 음절 unigram에 대한 가중치이다
6 6
제5항에 있어서, 상기 단계 (f)에서의 계산 결과로부터 한국어에서의 출현 확률과 외국어에서의 출현 확률을 비교하여 외국어에서의 출현 확률이 더 클 경우에는 해당 형태소를 외래어로 판단하는 외래어의 판별 방법
7 6
제5항에 있어서, 상기 단계 (f)에서의 계산 결과로부터 한국어에서의 출현 확률과 외국어에서의 출현 확률을 비교하여 외국어에서의 출현 확률이 더 클 경우에는 해당 형태소를 외래어로 판단하는 외래어의 판별 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.