기술이전플랫폼 Tech-Bridge-이전대상기술

맞춤기술찾기

홈으로 가기

맞춤기술찾기

이전대상기술

프린트하기

이전대상기술

중국어 미등록어 자동 추출 방법 및 장치

기술번호 : KST2015083375
담당센터 : 대전기술혁신센터
전화번호 : 042-610-2279

상담신청 PDF 받기

상세정보
공개전문
공고전문
등록사항
통합행정정보
기술정보
과제정보
관련기술
심판사항

서지정보
인명정보
행정처리
청구항
지정국
패밀리정보
국가R&D 연구정보

이전 슬라이드 보기 다음 슬라이드 보기

요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약	본 발명은 중국어 미등록어 자동 추출 기술에 관한 것으로, 중국어 문장이 포함된 웹문서를 입력받으면, 입력된 웹문서의 html 태그를 제거하고, 웹문서 내의 문장별로 메타 태그와 일반 태그 처리 방식으로 분류하며, 형태소 분석을 진행하여 분석결과를 출력하고, 분석 결과를 이용하여 어근 중심의 미등록어를 추출하는 방식과, 단음절 토큰을 중심으로 미등록어를 추출하는 방식과, 4음절로 된 동사 미등록어를 추출하는 방식과, 단음절 토큰의 단어 가능 여부를 판단하여 단어 가능 미등록어를 추출하는 방식과, 메타 태그 정보에 포함된 단어를 이용하여 미등록어를 추출하는 방식 중 적어도 하나의 방식을 이용하여 미등록어를 추출하는 것을 특징으로 한다. 본 발명에 의하면, 중국어 미등록어 추출방식을 통하여 쉽고 빠르게 중국어 분석용 사전을 구축 할 수 있으며, 특히 신조어, 미등록 용언에 대한 사전 보강은 실제 웹문서 번역시스템에 있어서 정확도를 크게 향상 시킬 수 있다.중국어, 어근, 단음절, 메타 태그 정보
Int. CL	G06F 17/27 (2006.01) G06F 17/30 (2006.01)
CPC	G06F 17/2863(2013.01) G06F 17/2863(2013.01) G06F 17/2863(2013.01) G06F 17/2863(2013.01) G06F 17/2863(2013.01) G06F 17/2863(2013.01)
출원번호/일자	1020070129360 (2007.12.12)
출원인	한국전자통신연구원
등록번호/일자	10-0886687-0000 (2009.02.25)
공개번호/일자
공고번호/일자	(20090304) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태	등록
심사진행상태	수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자	Y (2007.12.12)
심사청구항수	8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호	이름	국적	주소
1	한국전자통신연구원	대한민국	대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호	이름	국적	주소
1	윤창호	대한민국	대전 유성구
2	권오욱	대한민국	대전 서구
3	오영순	대한민국	경기 수원시 영통구
4	노윤형	대한민국	대전 유성구
5	최승권	대한민국	대전 유성구
6	서영애	대한민국	대전 유성구
7	이기영	대한민국	대전 서구
8	양성일	대한민국	대전 유성구
9	김창현	대한민국	대전 유성구
10	김영길	대한민국	대전 중구
11	김운	대한민국	대전 유성구
12	황영숙	대한민국	대전 유성구
13	박은진	대한민국	대전 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호	이름	국적	주소
1	장성구	대한민국	서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))
2	김원준	대한민국	서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호	이름	국적	주소
1	대한민국(산업통상자원부장관)		세종특별자치시 한누리대

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서 [Patent Application] Patent Application	2007.12.12	수리 (Accepted)	1-1-2007-0894659-80
2	선행기술조사의뢰서 Request for Prior Art Search	2008.07.08	수리 (Accepted)	9-1-9999-9999999-89
3	선행기술조사보고서 Report of Prior Art Search	2008.08.12	수리 (Accepted)	9-1-2008-0052696-31
4	등록결정서 Decision to grant	2009.02.24	발송처리완료 (Completion of Transmission)	9-5-2009-0083755-81
5	출원인정보변경(경정)신고서 Notification of change of applicant's information	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
6	출원인정보변경(경정)신고서 Notification of change of applicant's information	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44

번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호	청구항
1	1 중국어 문장이 포함된 웹문서를 입력받으면, 상기 입력된 웹문서의 html 태그를 제거하는 과정과,상기 웹문서 내의 문장별로 메타 태그와 일반 태그 처리 방식으로 분류하는 과정과,형태소 분석을 진행하여 분석결과를 출력하는 과정과,상기 분석 결과를 이용하여 어근 중심의 미등록어를 추출하는 방식과, 단음절 토큰을 중심으로 미등록어를 추출하는 방식과, 4음절로 된 동사 미등록어를 추출하는 방식과, 상기 단음절 토큰의 단어 가능 여부를 판단하여 단어 가능 미등록어를 추출하는 방식과, 상기 메타 태그 정보에 포함된 단어를 이용하여 미등록어를 추출하는 방식 중 적어도 하나의 방식을 이용하여 미등록어를 추출하는 과정을 포함하는 중국어 미등록어 자동 추출 방법
2	2 제 1항에 있어서, 상기 분석 결과를 이용하여 어근사전을 구축하고, 어근을 중심으로 미등록어를 추출하는 과정과,단음절 나열에 대해서 빈도를 구하고, 기 설정된 빈도수를 초과하는 경우 미등록어로 추출하는 과정과,동사로 태깅된 동사열에 대해서 빈도를 구하여 4음절 미등록어의 동사를 추출하는 과정을 포함하는 것을 특징으로 하는 중국어 미등록어 자동 추출 방법
3	3 제 1항에 있어서, 상기 방법은,학습코퍼스를 이용하여 단음절 토큰의 단독 단어 가능여부를 판단하는 과정과,상기 단음절 단어로 불가능한 토큰에 대해서 좌우 문맥 정보를 이용하여 확장을 통하여 미등록어를 추출하는 과정을 포함하는 것을 특징으로 하는 중국어 미등록어 자동 추출 방법
4	4 제 1항에 있어서, 상기 방법은,상기 메타 태그 정보에 포함된 단어를 토큰 길이별로 분류하는 과정과,상기 토큰 길이가 1이며, 기 설정된 빈도수를 초과하는 단어를 미등록어로 추출하는 과정과,상기 토큰 길이가 2 이상이며, 형태소 분석결과 명사인 경우, 미등록어로 추출하는 과정을 포함하는 것을 특징으로 하는 중국어 미등록어 자동 추출 방법
5	5 중국어 문장이 포함된 웹문서를 입력받으면, 상기 입력된 웹문서의 html 태그를 제거하는 제거부와,상기 웹문서 내의 문장별로 메타 태그와 일반 태그 처리 방식으로 분류하는 태그 분류부와,형태소 분석을 진행하여 분석결과를 출력하는 형태소 분석부와,상기 분석 결과를 이용하여 어근 중심의 미등록어를 추출하는 어근 중심 추출 모듈과, 단음절 토큰을 중심으로 미등록어를 추출하는 단음절 중심 추출 모듈과, 4음절로 된 동사 미등록어를 추출하는 동사 중심 추출 모듈을 포함하는 일반 태그를 이용한 추출 방식부와,상기 단음절 토큰의 단어 가능 여부를 판단하여 단어 가능 미등록어를 추출하는 단음절 토큰의 단어 가능 여부를 이용한 추출 방식부와,상기 메타 태그 정보에 포함된 단어를 이용하여 미등록어를 추출하는 메타 태그를 이용한 추출 방식부를 포함하는 중국어 미등록어 자동 추출 시스템
6	6 제 5항에 있어서,상기 일반 태그를 이용한 추출 방식부는,상기 형태소 분석 결과를 이용하여 어근사전을 구축하고, 어근을 중심으로 미등록어를 추출하고, 단음절 나열에 대해서 빈도를 구하고, 기 설정된 빈도수를 초과하는 경우 미등록어로 추출하고,동사로 태깅된 동사열에 대해서 빈도를 구하여 4음절 미등록어의 동사를 추출하는 것을 특징으로 하는 중국어 미등록어 자동 추출 시스템
7	7 제 5항에 있어서,상기 단음절 토큰의 단어 가능 여부를 이용한 추출 방식부는,학습코퍼스를 이용하여 단음절 토큰의 단독 단어 가능여부를 판단하고, 상기 단음절 단어로 불가능한 토큰에 대해서 좌우 문맥 정보를 이용한 확장을 통하여 미등록어를 추출하는 것을 특징으로 하는 중국어 미등록어 자동 추출 시스템
8	8 제 5항에 있어서,상기 메타 태그를 이용한 추출 방식부는,상기 메타 태그 정보에 포함된 단어를 토큰 길이별로 분류하여, 상기 토큰 길이가 1인 경우에 기 설정된 빈도수를 초과하는 단어를 미등록어로 추출하고,상기 토큰 길이가 2 이상이며, 형태소 분석결과 명사인 경우, 미등록어로 추출하는 것을 특징으로 하는 중국어 미등록어 자동 추출 시스템

순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번	연구부처	주관기관	연구사업	연구과제
1	정보통신부	한국전자통신연구원	IT성장동력기술개발사업	응용 특화 한중영 자동번역 기술개발

본 등록정보는 참고용으로 법적증빙자료로 사용할 수 없습니다.
데이터 이관에 따른 소요기간(1일)으로 인하여 등록원부와 일부 차이가 발생할 수 있으며, 일부 정보(부기, 상세 주소 등)를 제공하지 않고 있습니다.
법적증빙자료로 활용하시거나 더 자세한 정보를 보시려면 등록원부를 발급받아 사용하시기 바랍니다.

이전대상기술 뷰 페이지 등록사항 > 특허 등록번호 표입니다.
특허 등록번호	10-0886687-0000

권리란

표시번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 권리란 표입니다.
표시번호	사항
1	출원 연월일 : 20071212 출원 번호 : 1020070129360 공고 연월일 : 20090304 공고 번호 : 특허결정(심결)연월일 : 20090224 청구범위의 항수 : 8 유별 : G06F 17/27 발명의 명칭 : 중국어 미등록어 자동 추출 방법 및 장치 존속기간(예정)만료일 :

특허권자란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 특허권자란 표입니다.
순위번호	사항
1	(권리자) 한국전자통신연구원 대전 유성구...
2	(의무자) 한국전자통신연구원 대전광역시 유성구...
2	(권리자) 대한민국(산업통상자원부장관) 세종특별자치시 한누리대...

등록료란

순위번호, 사항의 정보를 제공하는 이전대상기술 뷰 페이지 등록사항 > 등록료란 표입니다.
제 1 - 3 년분	금 액	178,500 원	2009년 02월 26일	납입
제 4 - 20 년분	금 액	0 원	2011년 12월 08일	납입

본 '원본보기 서비스'는 참고용이므로, 일부 오류 및 누락이 발생할 수 있습니다.
정확한 서류를 확인하시려면 해당 웹사이트에서 조회하시기 바랍니다. (특허로 바로가기: http://www.patent.go.kr)
해당 서비스는 점검으로 인해 매주 일요일 00:00 ~ 02:00까지 이용이 중단됩니다.

번호, 서류명, 접수/발송일자, 처리상태, 접수/발송번호의 정보를 제공하는 이전대상기술 뷰 페이지 통합행정정보 > 등록료란 표입니다.
번호	서류명	접수/발송일자	처리상태	접수/발송번호
1	[특허출원]특허출원서	2007.12.12	수리 (Accepted)	1-1-2007-0894659-80
2	선행기술조사의뢰서	2008.07.08	수리 (Accepted)	9-1-9999-9999999-89
3	선행기술조사보고서	2008.08.12	수리 (Accepted)	9-1-2008-0052696-31
4	등록결정서	2009.02.24	발송처리완료 (Completion of Transmission)	9-5-2009-0083755-81
5	출원인정보변경(경정)신고서	2009.08.04	수리 (Accepted)	4-1-2009-5150899-36
6	출원인정보변경(경정)신고서	2015.02.02	수리 (Accepted)	4-1-2015-0006137-44


과제고유번호	1445006161
세부과제번호	2006-S-037-02
연구과제명	응용특화한중영자동번역기술개발
성과구분	출원
부처명	지식경제부
연구관리전문기관명	정보통신연구진흥원
연구주관기관명	한국전자통신연구원
성과제출연도	2007
연구기간	200703~200802
기여율	1
연구개발단계명	개발연구
6T분류명	IT(정보기술)

특허성과

[1020080104184]	복합 명사의 동일 의미 문장 생성을 위한 문장 성분 복원 장치 및 방법	새창보기
[1020080066395]	실시간 대화식 기계 번역 장치 및 방법	새창보기
[1020070133677]	한영 자동번역 방법 및 장치	새창보기
[1020070129360]	중국어 미등록어 자동 추출 방법 및 장치	새창보기
[1020070128564]	자동번역 시스템에서의 영어 어휘 패턴 구축 방법 및 장치	새창보기
[1020070128563]	한국어 수량사 생성 방법 및 장치	새창보기
[1020070128041]	번역 시스템에서 오류 보정 패턴을 이용한 번역 오류 수정 방법 및 장치	새창보기
[1020070080065]	번역 지식 구축 방법 및 장치	새창보기
[1020070075581]	ＰＤＦ 파일을 대상으로 하는 자동 번역 방법	새창보기

중요키워드

이전대상기술 뷰 페이지 관련기술 표
[KST2014062867][한국전자통신연구원]	사용자 맞춤 광고 확장을 위한 지능형 모바일 검색 기술	새창보기
[KST2014030487][한국전자통신연구원]	멀티미디어 검색을 위한 질의 표현 장치 및 방법	새창보기
[KST2014031736][한국전자통신연구원]	요소화 언어모델을 이용한 번역 오류 후처리 보정 방법 및 장치	새창보기
[KST2014032377][한국전자통신연구원]	위성 관제 시스템에서 위성 관제 운용 자동화를 위한 언어변환장치 및 방법	새창보기
[KST2014062795][한국전자통신연구원]	UCI 참조연계 플레이어 시스템	새창보기
[KST2014045120][한국전자통신연구원]	방문 히스토리 누적에 기반한 하이퍼링크 표시 방법	새창보기
[KST2014045309][한국전자통신연구원]	구성 변경 가능한 어플리케이션에서 사용될 비즈니스 로직 생성 방법 및 장치	새창보기
[KST2014062889][한국전자통신연구원]	시맨틱 멀티미디어 콘텐츠 검색 기술	새창보기
[KST2014062825][한국전자통신연구원]	음악 추천 SW	새창보기
[KST2014062888][한국전자통신연구원]	SNS 단문 기반 사용자 관심 분석 기술	새창보기
[KST2014031699][한국전자통신연구원]	3차원 모델 데이터 검색 장치	새창보기
[KST2014036016][한국전자통신연구원]	한국어 어휘 사전 DB	새창보기
[KST2014053472][한국전자통신연구원]	소셜 웹 복합이슈 탐지-모니터링 시스템	새창보기
[KST2014062807][한국전자통신연구원]	지오웹 매쉬업 엔진 v3.0	새창보기
[KST2014030587][한국전자통신연구원]	멀티미디어 콘텐츠를 검색하는 방법 및 장치	새창보기
[KST2014031657][한국전자통신연구원]	통계정보를 이용한 규칙 기반 구문분석 장치 및 방법	새창보기
[KST2014032342][한국전자통신연구원]	모바일 기기에서 사용자 상호작용을 이용한 자동 번역 장치 및 그 방법	새창보기
[KST2014045284][한국전자통신연구원]	확장필드를 응용한 온라인 애플리케이션 장치 및 방법	새창보기
[KST2014045645][한국전자통신연구원]	시간 연속성을 이용한 이웃 파티클 탐색 장치 및 방법	새창보기
[KST2014045728][한국전자통신연구원]	질문 형태 및 도메인 인식 장치 및 그 방법	새창보기
[KST2014031600][한국전자통신연구원]	중국어 구문 분절 방법 및 장치	새창보기
[KST2014031919][한국전자통신연구원]	검색어를 이용한 정보 검색 방법	새창보기
[KST2014045777][한국전자통신연구원]	포렌식 데이터의 데이터테이블 생성 장치 및 방법	새창보기
[KST2014062747][한국전자통신연구원]	텍스트 핑거프린트를 이용한 출판물 식별 기술	새창보기
[KST2014062826][한국전자통신연구원]	뮤직내비게이션 SW	새창보기
[KST2014066352][한국전자통신연구원]	멀티스케일 맞춤형 서비스 플랫폼 기술	새창보기
[KST2014031757][한국전자통신연구원]	이형태 자동 구축 방법 및 장치	새창보기
[KST2014032060][한국전자통신연구원]	디지털 비디오 관리 및 검색 시스템	새창보기
[KST2014032131][한국전자통신연구원]	다차원 공간에서 스카이라인 객체가 되기 위한 최소 비용 벡터 획득 방법 및 장치	새창보기
[KST2014045879][한국전자통신연구원]	통신 시스템에서 멀티미디어 서비스 제공 시스템 및 방법	새창보기

의뢰할 수요기술을 선택합니다

담당자명, 주소, 이메일, 연락처, 내용, 파일선택의 정보를 제공하는 도입희망기술 뷰 페이지 의뢰하기 입력표입니다.
담당자명		활동구분※필수입력항목
이메일		연락처	- -
내용
파일선택	파일선택

기술이전 상담신청 드립니다.
기업명
신청자 성명		직책
연락처	- -
이메일	@
상담희망전담센터	※ 사업장(본점) 소재지가 속한 지역의 기술혁신센터를 지정해주세요.