맞춤기술찾기

이전대상기술

유사문서 판별장치 및 이를 이용한 유사문서 판별방법

  • 기술번호 : KST2019036475
  • 담당센터 : 대구기술혁신센터
  • 전화번호 : 053-550-1450
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은, 다수의 문서 각각의 텍스트를 엔그램으로 변환하고, 상기 엔그램을 이용하여 다수의 해시정수의 히스토그램을 산출하는 데이터 산출부와; 상기 다수의 해시정수의 히스토그램을 저장하여 데이터베이스화 하는 저장부와; 상기 저장부의 상기 다수의 해시정수의 히스토그램으로부터 문서거리를 산출하고, 상기 문서거리를 이용하여 상기 다수의 문서 중 적어도 2개의 유사여부를 판별하는 유사 판별부를 포함하는 유사문서 판별장치를 제공한다.
Int. CL G06F 16/00 (2019.01.01) G06F 17/21 (2006.01.01)
CPC G06F 16/152(2013.01) G06F 16/152(2013.01)
출원번호/일자 1020160086863 (2016.07.08)
출원인 금오공과대학교 산학협력단
등록번호/일자 10-1804810-0000 (2017.11.29)
공개번호/일자
공고번호/일자 (20171205) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2016.07.08)
심사청구항수 5

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 금오공과대학교 산학협력단 대한민국 경상북도 구미시

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최태영 대한민국 경상북도 구미시
2 김재준 대한민국 대구광역시 달서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 네이트특허법인 대한민국 서울특별시 강남구 역삼로 ***, ***호(역삼동, 하나빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 금오공과대학교 산학협력단 경상북도 구미시
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2016.07.08 수리 (Accepted) 1-1-2016-0663293-22
2 의견제출통지서
Notification of reason for refusal
2017.04.20 발송처리완료 (Completion of Transmission) 9-5-2017-0283420-14
3 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2017.06.14 수리 (Accepted) 1-1-2017-0565610-72
4 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2017.06.14 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2017-0565609-25
5 등록결정서
Decision to grant
2017.11.27 발송처리완료 (Completion of Transmission) 9-5-2017-0827567-10
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.04.06 수리 (Accepted) 4-1-2020-5079599-14
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
다수의 문서 각각의 텍스트를 엔그램으로 변환하고, 상기 엔그램을 이용하여 다수의 해시정수의 히스토그램을 산출하는 데이터 산출부와;상기 다수의 해시정수의 히스토그램을 저장하여 데이터베이스화 하는 저장부와;상기 저장부의 상기 다수의 해시정수의 히스토그램으로부터 문서거리를 산출하고, 상기 문서거리를 이용하여 상기 다수의 문서 중 적어도 2개의 유사여부를 판별하는 유사 판별부를 포함하고,상기 데이터 산출부는,상기 다수의 문서 각각으로부터 상기 텍스트를 추출하는 텍스트 추출부와;상기 텍스트를 상기 엔그램으로 변환하는 엔그램 변환부와;상기 엔그램을 해시함수에 따라 해시정수로 변환하는 해시정수 변환부와;상기 해시정수로부터 빈도정보를 추출하는 빈도정보 추출부와;상기 빈도정보를 이용하여 상기 다수의 해시정수의 히스토그램을 산출하는 히스토그램 산출부를 포함하고,상기 해시함수는, 상기 텍스트에 대응되는 유니코드값들을 서로 더하는 연산(C_i + C_{i+1}) 또는 상기 텍스트에 대응되는 유니코드값들을 서로 빼는 연산(C_i - C_{i+1})인 유사문서 판별장치
2 2
삭제
3 3
삭제
4 4
제 1 항에 있어서, 상기 엔그램은 다수의 그램요소를 포함하고,상기 해시정수는 상기 해시함수에 따라 상기 다수의 그램요소에 대응되는 다수의 해시정수값을 포함하고,상기 빈도정보는 상기 다수의 해시정수값 각각이 상기 텍스트 전체에서 발생한 횟수에 대한 정보인 유사문서 판별장치
5 5
제 1 항에 있어서, 상기 유사 판별부는,상기 다수의 해시정수의 히스토그램 중 적어도 2개로부터 상기 문서거리를 산출하는 문서거리 산출부와;상기 문서거리를 미리 결정된 임계거리와 비교하여 유사여부를 판단하는 판단부를 포함하는 유사문서 판별장치
6 6
데이터 산출부가 다수의 문서 각각의 텍스트를 엔그램으로 변환하는 단계와;상기 데이터 산출부가 상기 엔그램을 이용하여 다수의 해시정수의 히스토그램을 산출하는 단계와;저장부가 상기 다수의 해시정수의 히스토그램을 저장하여 데이터베이스화 하는 단계와;유사 판별부가 상기 다수의 해시정수의 히스토그램으로부터 문서거리를 산출하는 단계와;상기 유사 판별부가 상기 문서거리를 이용하여 상기 다수의 문서 중 적어도 2개의 유사여부를 판별하는 단계를 포함하고, 상기 텍스트를 상기 엔그램으로 변환하는 단계는, 상기 데이터 산출부의 텍스트 추출부가 상기 다수의 문서 각각으로부터 상기 텍스트를 추출하는 단계를 포함하고,상기 다수의 해시정수의 히스토그램을 산출하는 단계는, 상기 데이터 산출부의 해시정수 변환부가 상기 엔그램을 해시함수에 따라 해시정수로 변환하는 단계와;상기 데이터 산출부의 빈도정보 추출부가 상기 해시정수로부터 빈도정보를 추출하는 단계와; 상기 데이터 산출부의 히스토그램 산출부가 상기 빈도정보를 이용하여 상기 다수의 해시정수의 히스토그램을 산출하는 단계를 포함하고,상기 해시함수는, 상기 텍스트에 대응되는 유니코드값들을 서로 더하는 연산(C_i + C_{i+1}) 또는 상기 텍스트에 대응되는 유니코드값들을 서로 빼는 연산(C_i - C_{i+1})인 유사문서 판별방법
7 7
삭제
8 8
삭제
9 9
삭제
10 10
제 6 항에 있어서, 상기 다수의 문서 중 적어도 2개의 유사여부를 판별하는 단계는, 상기 유사 판별부의 문서거리 산출부가 상기 다수의 해시정수의 히스토그램 중 적어도 2개로부터 상기 문서거리를 산출하는 단계와;상기 유사 판별부의 판단부가 상기 문서거리를 미리 결정된 임계거리와 비교하여 유사여부를 판단하는 단계를 포함하는 유사문서 판별방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.