맞춤기술찾기

이전대상기술

전자 문서 처리 장치 및 그 방법

  • 기술번호 : KST2015084573
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 다수의 전자 문서 셋에서 중복 문서를 판별하는 기법에 관한 것으로, 이를 위하여 본 발명은, 전자 문서의 내용을 해쉬값으로 변환하고 이의 충돌 여부에 따라 중복 문서임을 판단하는 종래 방법과는 달리, 전자 문서 처리 장치를 이용하여 입력되는 전자 문서의 본문 내용을 추출한 후 각각의 문장을 분리하고, 분리된 각 문장을 해쉬 알고리즘을 통해 변환하며, 기 저장된 해쉬값과의 충돌 여부에 따라 중복 문장 여부를 판단한 후에, 중복 문장 비율을 산출하여 기 설정된 비율값에 따라 선택적으로 중복 문서임을 판단함으로써, 전자 문서 내 각 문장의 중복 여부에 따라 해당 전자 문서의 중복 여부를 판단할 수 있는 것이다. 문서 처리, 중복 문서
Int. CL G06F 17/21 (2006.01) G06F 17/22 (2006.01) G06F 17/30 (2006.01)
CPC
출원번호/일자 1020080125438 (2008.12.10)
출원인 한국전자통신연구원
등록번호/일자
공개번호/일자 10-2010-0066920 (2010.06.18) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 거절
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2008.12.10)
심사청구항수 10

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 윤여찬 대한민국 서울특별시 양천구
2 장명길 대한민국 대전광역시 유성구
3 김현기 대한민국 대전광역시 서구
4 황이규 대한민국 전북 전주시 완산구
5 임수종 대한민국 대전광역시 유성구
6 허정 대한민국 대전광역시 유성구
7 이충희 대한민국 대전광역시 유성구
8 오효정 대한민국 대전광역시 서구
9 이창기 대한민국 대전광역시 유성구
10 최미란 대한민국 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 제일특허법인(유) 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)
2 김원준 대한민국 서울특별시 서초구 마방로 ** (양재동, 동원F&B빌딩)(제일특허법인(유))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2008.12.10 수리 (Accepted) 1-1-2008-0851168-67
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
3 의견제출통지서
Notification of reason for refusal
2011.03.07 발송처리완료 (Completion of Transmission) 9-5-2011-0126911-19
4 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2011.05.06 수리 (Accepted) 1-1-2011-0338236-12
5 의견제출통지서
Notification of reason for refusal
2011.11.25 발송처리완료 (Completion of Transmission) 9-5-2011-0689231-74
6 거절결정서
Decision to Refuse a Patent
2012.06.21 발송처리완료 (Completion of Transmission) 9-5-2012-0358988-77
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
다수의 문서 셋 중에서 전자 문서를 추출하고, 상기 추출된 전자 문서의 본문 내용을 추출하는 문서 추출 블록과, 상기 추출된 본문 내용에서 각 문장을 분리하는 문장 분리 블록과, 상기 분리된 각 문장에 대해 해쉬 알고리즘을 이용하여 고유한 해쉬값으로 변환하고, 상기 변환된 해쉬값과 기 저장된 해쉬값과의 충돌 여부에 따라 중복 문장 여부를 판단하고, 상기 전자 문서에 대한 중복 문장 비율에 따라 중복 문서 여부를 판단하는 중복 문서 판별 블록 을 포함하는 전자 문서 처리 장치
2 2
제 1 항에 있어서, 상기 중복 문서 판별 블록은, 상기 분리된 각 문장에 대해 상기 해쉬 알고리즘을 이용하여 상기 각 문장 내 각각의 문자들을 고유한 해쉬값으로 변환하는 해쉬 변환부와, 상기 변환된 해쉬값과 상기 문서 셋의 문장들에 대응하여 기 저장된 해쉬값을 비교하고, 해쉬값 충돌이 발생할 경우 상기 중복 문장으로 판단하는 중복 문장 판별부와, 상기 전자 문서에 대해 상기 중복 문장으로 판단된 중복 문장 비율값이 기 설정된 비율값을 초과하는 경우 상기 전자 문서를 중복 문서로 판단하는 중복 비율 비교부 를 포함하는 전자 문서 처리 장치
3 3
제 2 항에 있어서, 상기 중복 문장 판별부는, 상기 해쉬값 충돌이 발생하지 않은 미중복 문장을 해쉬 테이블화하여 저장하는 전자 문서 처리 장치
4 4
제 1 항 또는 제 2 항에 있어서, 상기 해쉬 알고리즘은, md5(message-digest algorithm 5)인 전자 문서 처리 장치
5 5
제 1 항 또는 제 2 항에 있어서, 상기 전자 문서는, HTML, TXT, DOC, HWP 중 어느 하나의 형태를 갖는 전자 문서 처리 장치
6 6
다수의 문서 셋 중에서 전자 문서를 추출하여 그 본문 내용을 추출하는 단계와, 상기 추출된 본문 내용에서 각 문장을 분리하는 단계와, 상기 분리된 각 문장에 대해 해쉬 알고리즘을 이용하여 고유한 해쉬값으로 변환하는 단계와, 상기 변환된 해쉬값과 기 저장된 해쉬값과의 충돌 여부에 따라 중복 문장 여부를 판단하는 단계와, 상기 전자 문서에 대한 중복 문장 비율에 따라 중복 문서 여부를 판단하는 단계 를 포함하는 전자 문서 처리 방법
7 7
제 6 항에 있어서, 상기 고유한 해쉬값으로 변환하는 단계는, 상기 분리된 각 문장에 대해 상기 해쉬 알고리즘을 이용하여 상기 각 문장 내 각각의 문자들을 고유한 해쉬값으로 변환하는 전자 문서 처리 방법
8 8
제 6 항에 있어서, 상기 중복 문장 여부를 판단하는 단계는, 상기 변환된 해쉬값과 상기 문서 셋의 문장들에 대응하여 기 저장된 해쉬값을 비교하고, 해쉬값 충돌이 발생할 경우 상기 중복 문장으로 판단하는 전자 문서 처리 방법
9 9
제 8 항에 있어서, 상기 중복 문서 여부를 판단하는 단계는, 상기 해쉬값 충돌이 발생하지 않은 미중복 문장을 해쉬 테이블화하여 저장하는 전자 문서 처리 방법
10 10
제 6 항에 있어서, 상기 중복 문서 여부를 판단하는 단계는, 상기 전자 문서에 대해 상기 중복 문장으로 판단된 중복 문장 비율값이 기 설정된 비율값을 초과하는 경우 상기 전자 문서를 중복 문서로 판단하는 전자 문서 처리 방법
지정국 정보가 없습니다
순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - 패밀리정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US20100145952 US 미국 FAMILY

DOCDB 패밀리 정보

순번, 패밀리번호, 국가코드, 국가명, 종류의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 패밀리정보 - DOCDB 패밀리 정보 표입니다.
순번 패밀리번호 국가코드 국가명 종류
1 US2010145952 US 미국 DOCDBFAMILY
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 지식경제부 및 정보통신연구진흥원 한국전자통신연구원 IT성장동력핵심기술개발사업 국가 IT온톨로지 인프라 기술개발