맞춤기술찾기

이전대상기술

원시 말뭉치로부터 미등록 단어를 추출하는 방법(Method for extracting unknown word from raw corpus)

  • 기술번호 : KST2016010954
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 실시 예들은, 원시 말뭉치로부터 미등록 단어를 추출하는 방법에 관한 것으로, 본 발명의 일 실시 예에 따른 미등록 단어 추출 방법은, 말뭉치를 청크 단위로 분리하는 단계; 단어 사전, 문자열 독립성 정보, 기능어 여부 및 문법 규칙 중 적어도 하나를 기반으로, 상기 청크 단위의 문자열에 대하여 단어 분리 위치를 기록하는 단계; 상기 기록된 단어 분리 위치를 기반으로 미등록 단어 후보를 추출하는 단계; 및 상기 추출된 미등록 단어 후보 중 상기 단어 사전에 등록된 단어를 제외한 나머지 단어를 미등록 단어로서 추출하는 단계를 포함한다. 본 발명의 실시 예들에 따르면, 대량의 가공된 언어 자원 없이, 띄어쓰기가 없는 언어로 이루어진 원시 말뭉치만으로 용이하게 미등록 단어를 추출할 수 있다.
Int. CL G06F 17/27 (2006.01.01) G06F 17/28 (2006.01.01)
CPC G06F 40/20(2013.01) G06F 40/20(2013.01) G06F 40/20(2013.01)
출원번호/일자 1020140162885 (2014.11.20)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2016-0061448 (2016.06.01) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 취하
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 N
심사청구항수 1

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김운 중국 대전시 유성구
2 김영길 대한민국 대전광역시 서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인이지 대한민국 서울특별시 금천구 가산디지털*로 ***(가산동, KCC웰츠밸리) ***-***

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2014.11.20 수리 (Accepted) 1-1-2014-1121808-33
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
말뭉치를 청크 단위로 분리하는 단계; 단어 사전, 문자열 독립성 정보, 기능어 여부 및 문법 규칙 중 적어도 하나를 기반으로, 상기 청크 단위의 문자열에 대하여 단어 분리 위치를 기록하는 단계; 상기 기록된 단어 분리 위치를 기반으로 미등록 단어 후보를 추출하는 단계; 및 상기 추출된 미등록 단어 후보 중 상기 단어 사전에 등록된 단어를 제외한 나머지 단어를 미등록 단어로서 추출하는 단계를 포함하는 미등록 단어 추출 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.