1 |
1
사용자로부터 유사도 비교를 위한 두 문서정보를 입력받는 입력모듈과,입력된 두 문서정보에서 특수문자를 제거하고 일정한 길이의 여러 블록으로 나눈 뒤, 나누어진 각 블록마다 출현 단어의 빈도를 이용하여 지문을 형성하는 전처리 모듈과,상기 전처리 모듈에서 형성된 각 블록의 지문을 서로 비교하여 블록 간의 유사도를 계산하고, 계산된 결과를 이용하여 유사도 테이블을 생성하는 유사도 테이블 생성모듈과,상기 유사도 테이블 생성모듈에서 생성된 유사도 테이블에서 서열정렬법을 이용하여 유사한 구간을 탐색하여 표절의심 구간을 검출하는 서열 정렬모듈을 포함하여 구성되며,이때, 상기 유사도 테이블 생성모듈은각 블록의 지문을 서로 비교하여 블록 간의 유사도를 비교하는 지문간의 유사도 비교부와,상기 유사도 비교부에서 비교된 유사도가 임계치보다 크면 비교 단계를 추가하여 해당 블록을 다시 여러 블록으로 분할하여 상기 지문간의 유사도 비교부를 통해 블록 간의 유사도를 다시 비교하도록 하는 지분 비교단계 조절부와,블록 간의 비교 결과를 유사도 표로 생성하여 유사도 테이블을 기록하는 유사도 테이블 기록부를 포함하는 것을 특징으로 하는 문서간의 유사도 비교 장치
|
2 |
2
제 1 항에 있어서, 상기 문서정보는 문서파일과, 문서파일의 블록크기, 검색 단계수(depth), 블록의 분할되는 개수를 나타내는 임계치를 포함하는 것을 특징으로 하는 문서간의 유사도 비교 장치
|
3 |
3
제 1 항에 있어서, 상기 전처리 모듈은입력된 두 문서정보를 여러 블록으로 분할하는 문서 분할부와,상기 분할된 각 블록마다 지문을 추출하는 지문 추출부와,상기 추출된 각 블록의 지문을 합하여 상위 단계의 지문을 단계수만큼 추출하여 조합하는 다단계 지문 조합부를 포함하는 것을 특징으로 하는 문서간의 유사도 비교 장치
|
4 |
4
제 1 항에 있어서,상기 유사도는 두 문서를 구성하는 단어의 출현 빈도를 비교하여 계산되는 것을 특징으로 하는 문서간의 유사도 비교 장치
|
5 |
5
삭제
|
6 |
6
제 1 항에 있어서, 상기 문서간의 유사도 비교 장치는 상기 서열 정렬모듈에서 검출된 표절의심 구간을 사용자에게 제공하는 비교결과 시각화모듈을 포함하여 구성되는 것을 특징으로 하는 문서간의 유사도 비교 장치
|
7 |
7
(A) 입력된 두 문서정보에서 특수문자를 제거하고 일정한 길이의 여러 블록으로 나눈 뒤, 나누어진 각 블록마다 출현 단어의 빈도를 이용하여 지문을 형성하는 단계와,(B) 상기 형성된 각 블록의 지문을 서로 비교하여 블록 간의 유사도를 계산하고, 계산된 결과를 이용하여 유사도 테이블을 생성하는 단계와,(C) 상기 생성된 유사도 테이블에서 서열정렬법을 이용하여 유사한 구간을 탐색하여 표절의심 구간을 검출하는 단계를 포함하여 이루어지며,이때, 상기 (B) 단계는(B1) 조합된 블록의 크기를 이용하여, 각 블록의 지문을 서로 비교하여 블록 간의 유사도를 비교하는 단계와,(B2) 상기 비교결과, 두 블록의 유사도가 미리 정의되어 있는 유사도 최대값(max)보다 큰 경우, 두 블록이 일치하는 것으로 설정하여 유사도 테이블을 생성하는 단계와,(B3) 상기 비교결과, 두 블록의 유사도가 미리 정의되어 있는 유사도 최대값(max) 및 유사도 최소값(min)보다 크지 않은 경우, 두 블록이 불일치하는 것으로 설정하여 유사도 테이블을 생성하는 단계와,(B4) 상기 비교결과, 두 블록의 유사도가 미리 정의되어 있는 유사도 최대값(max)보다 작고, 유사도 최소값(min)보다 큰 경우, 두 블록의 유사도를 더 자세히 비교해야 됨을 설정하는 단계와,(B5) 상기 (B4) 단계이후, 비교 단계(k)를 추가하여 해당 블록을 적어도 2개 이상의 블록으로 분할하여 블록 간의 유사도를 다시 비교하는 단계를 포함하는 것을 특징으로 하는 문서간의 유사도 비교 방법
|
8 |
8
제 7 항에 있어서,상기 (A) 단계에서 나누어진 각 블록은 미리 정해져 있는 임계치의 개수로 까지 분할되며, 분할되는 블록의 크기가 작아질수록 단계 수(k)는 커지는 것을 특징으로 하는 문서간의 유사도 비교 방법
|
9 |
9
제 7 항에 있어서,상기 유사도는 두 문서를 구성하는 단어의 출현 빈도를 비교하여 계산하는 것을 특징으로 하는 문서간의 유사도 비교 방법
|
10 |
10
제 7 항에 있어서, 상기 (A) 단계는입력된 두 문서정보를 여러 블록으로 분할하는 단계와,상기 분할된 각 블록마다 지문을 추출하는 단계와,상기 추출된 각 블록의 지문을 합하여 상위 단계의 지문을 단계수만큼 추출하여 조합하는 단계를 포함하는 것을 특징으로 하는 문서간의 유사도 비교 방법
|
11 |
11
삭제
|
12 |
12
제 7 항에 있어서, 상기 (B5) 단계는현재의 비교 단계(k)가 상기 (A) 단계에서 문서를 여러 블록으로 나누었을 때의 최대 분할 단계인 임계치보다 작은 경우까지 수행하는 것을 특징으로 하는 문서간의 유사도 비교 방법
|
13 |
13
제 7 항에 있어서,상기 (C) 단계에서 검출된 표절의심 구간을 사용자에게 보여주는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 문서간의 유사도 비교 방법
|