맞춤기술찾기

이전대상기술

지유아이 환경을 기반으로 하는 실시간 기사 수집 시스템및 온라인 언어 모델 구축 서비스 방법

  • 기술번호 : KST2015079425
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 방송뉴스 음성인식의 성능향상과 미등록 어휘수를 감소시키기 위해 최근의 방송뉴스와 신문기사를 실시간으로 수집하고 이에 대한 정보를 언어모델과 어휘사전에 반영할 수 있도록 GUI(Graphic User Interface)환경을 기반으로 하는 사용자 편의성을 고려한 실시간 기사 수집 시스템 및 온라인 언어 모델 구축 서비스 방법에 관한 것이다. 본 발명은 언론 매체의 웹사이트에 접속하여 수집된 기사들을 근거로 언어모델을 구축하기 위한 시스템을 이용한 서비스 방법에 있어서, 수집할 신문/방송등의 언론 매체와 상기 언론 매체에서 제공하는 기사들의 수집대상을 설정하는 것에 의해 해당 언론 매체의 웹사이트에 접속하여 기사를 실시간으로 다운로드하는 단계; 상기 수집된 기사들에 포함된 영어, 숫자 등을 한글로 변환하는 텍스트 변환단계; 수집된 최신 기사코퍼스에 대한 의사형태소를 태깅하는 단계; 수집된 최신 기사에 대한 어휘사전 작성, 언어모델 생성 및 발음사전을 구축하는 단계; 최신 기사코퍼스에 대한 어휘사전과 기존의 코퍼스의 어휘사전을 통합하여 새로운 어휘사전을 작성하는 단계; 및 기존의 작성된 언어모델과 수집된 언어모델을 인터폴레이션하여 음성인식 시스템으로 전송하는 단계;를 포함한다. 방송뉴스 음성인식, 실시간 기사 수집, 온라인 언어 모델 구축 서비스,
Int. CL G06F 17/21 (2006.01)
CPC G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01) G10L 15/183(2013.01)
출원번호/일자 1020030092517 (2003.12.17)
출원인 한국전자통신연구원
등록번호/일자 10-0561225-0000 (2006.03.08)
공개번호/일자 10-2005-0060795 (2005.06.22) 문서열기
공고번호/일자 (20060315) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2003.12.17)
심사청구항수 3

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김현숙 대한민국 대전광역시유성구
2 김상훈 대한민국 대전광역시유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 권태복 대한민국 서울시 강남구 테헤란로*길 **, *층 (역삼동, 청원빌딩)(아리특허법률사무소)
2 이화익 대한민국 서울시 강남구 테헤란로*길** (역삼동,청원빌딩) *층,***,***호(영인국제특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 특허출원서
Patent Application
2003.12.17 수리 (Accepted) 1-1-2003-0482141-07
2 선행기술조사의뢰서
Request for Prior Art Search
2005.06.15 수리 (Accepted) 9-1-9999-9999999-89
3 선행기술조사보고서
Report of Prior Art Search
2005.07.15 수리 (Accepted) 9-1-2005-0041665-65
4 의견제출통지서
Notification of reason for refusal
2005.08.19 발송처리완료 (Completion of Transmission) 9-5-2005-0398643-26
5 명세서등보정서
Amendment to Description, etc.
2005.10.18 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2005-0588934-17
6 의견서
Written Opinion
2005.10.18 수리 (Accepted) 1-1-2005-0588935-63
7 등록결정서
Decision to grant
2006.03.03 발송처리완료 (Completion of Transmission) 9-5-2006-0129728-12
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
수집된 기사로부터 언어모델을 생성하고 음성인식 시스템과 연동하는 것에 의해 음성기사를 문자로 변환하기 위한 언론 매체에서 제공하는 기사를 수집하는데 적합한 GUI화면을 구축한 시스템으로서,상기 GUI화면은 다수의 언론 매체를 선택하고, 선택된 해당 언론 매체에서 제공하는 기사의 종류, 기사의 시작/종료 날짜 및 시간대역을 설정하는 것에 의해 자동으로 해당 웹사이트에 접속하여 기사들을 실시간으로 수집하기 위한 메뉴창; 및상기 수집된 기사들을 근거로 총어휘수, 기사수 및 기존에 등록된 등록어와 비교하여 등록되지 않은 미등록어수에 대한 통계값을 자동으로 체크하여 표시하기 위한 통계자료창;을 포함하며,상기 수집된 기사들로부터 영어, 숫자를 한글로 변환하고, 숫자 발성, 띄워쓰기 및 맞춤법 오류를 수정하여 텍스트 형태로 변환한 후 의사형태소 태깅을 수행하여 언어모델을 생성하기 위한 시스템으로 전송하는 것을 특징으로 하는 GUI환경을 기반으로 하는 실시간 기사 수집시스템
2 2
제 1항에 있어서, 상기 GUI화면에 구비된 통계 자료창은 누적된 총어휘수, 기사수 및 미등록어수를 기록하기 위한 누적 통계자료창을 더 포함하는 것을 특징으로 하는 GUI환경을 기반으로 하는 실시간 기사 수집시스템
3 3
언론 매체의 웹사이트에 접속하여 수집된 기사들을 근거로 언어모델을 구축하기 위한 청구항 1의 시스템을 이용한 서비스 방법에 있어서,수집할 신문/방송등의 언론 매체와 상기 언론 매체에서 제공하는 기사들의 수집대상을 설정하는 것에 의해 해당 언론 매체의 웹사이트에 접속하여 기사를 실시간으로 다운로드하는 단계;상기 수집된 기사들에 포함된 영어, 숫자 등을 한글로 변환하는 텍스트 변환단계;수집된 최신 기사코퍼스에 대한 의사형태소를 태깅하는 단계;수집된 최신 기사에 대한 어휘사전 작성, 언어모델 생성 및 발음사전을 구축하는 단계;새로 수집한 코퍼스에 출현한 명사에 대한 어휘를 기존의 코퍼스의 어휘보다 우선적으로 어휘 사전에 포함시켜 최신 기사코퍼스에 대한 어휘사전과 기존의 코퍼스의 어휘사전을 통합하여 새로운 통합 어휘사전을 작성하는 단계; 및기존의 작성된 언어모델과 수집된 언어모델을 인터폴레이션하여 음성인식 시스템으로 전송하는 단계;를 포함하는 것을 특징으로 하는 GUI환경을 기반으로 하는 실시간 온라인 언어모델 구축 서비스 방법
4 4
삭제
5 4
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.