1 |
1
동일한 검색어에 기반하여 수집된 분석 데이터에 포함되는, 학술 문서와 기술 문서의 유사도를 검증하는 유사도 검증부;상기 검증된 유사도가 기준 값보다 높을 경우, 상기 학술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 학술 공통 키워드를 추출하는 학술 키워드 추출부;상기 추출된 적어도 하나 이상의 학술 공통 키워드를 상기 학술 문서의 저자 키워드와 비교하여 키워드 도출 성능을 검증하는 키워드 성능 검증부;상기 기술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 기술 공통 키워드를 추출하는 기술 키워드 추출부;상기 추출된 적어도 하나 이상의 기술 공통 키워드를 기술 문서 키워드로 도출하는 기술 문서 키워드 도출부;학술 문서 비교 그룹, 기술 문서 비교 그룹 및 학술 및 기술 문서 비교 그룹으로 상기 수집된 분석 데이터를 분류하는 데이터 분류부; 및상기 학술 문서 비교 그룹에서 학술 문서 간의 제1 유사도를 산출하고, 상기 기술 문서 비교 그룹에서 기술 문서 간의 제2 유사도를 산출하며, 상기 학술 및 기술 문서 비교 그룹에서 학술 문서와 기술 문서 간의 제3 유사도를 산출하는 유사도 산출부를 포함하는기술 문서 키워드를 도출하는 장치
|
2 |
2
삭제
|
3 |
3
제1항에 있어서,상기 유사도 검증부는,상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도의 평균값을 산출하고, 상기 산출된 평균값과 상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도 각각을 비교하며, 상기 산출된 평균값과 상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도 각각의 차이가 기설정된 기준 범위에 상응할 경우, 상기 유사도를 상기 기준 값보다 높은 것으로 검증하고, 상기 차이가 상기 기준 범위를 벗어날 경우, 상기 유사도를 상기 기준 값보다 낮은 것으로 검증하는 기술 문서 키워드를 도출하는 장치
|
4 |
4
제1항에 있어서,상기 유사도 산출부는,상기 학술 문서 비교 그룹에서 복수의 학술 문서의 제1 요약을 추출하고, 상기 추출된 제1 요약에 대한 텍스트 마이닝을 수행하여 제1 문서 단어 행렬로 정형화하고, 상기 정형화된 제1 문서 단어 행렬을 이용하여 상기 제1 유사도를 산출하는기술 문서 키워드를 도출하는 장치
|
5 |
5
제4항에 있어서,상기 유사도 산출부는,상기 기술 문서 비교 그룹에서 복수의 기술 문서의 제2 요약을 추출하고, 상기 추출된 제2 요약에 대한 텍스트 마이닝을 수행하여 제2 문서 단어 행렬로 정형화하고, 상기 정형화된 제2 문서 단어 행렬을 이용하여 상기 제2 유사도를 산출하는기술 문서 키워드를 도출하는 장치
|
6 |
6
제5항에 있어서,상기 유사도 산출부는,상기 학술 및 기술 문서 비교 그룹에서 복수의 학술 문서의 제3 요약 및 복수의 기술 문서의 제4 요약을 추출하고, 상기 추출된 제3 요약 및 상기 추출된 제4 요약에 대한 텍스트 마이닝을 수행하여 제3 문서 단어 행렬로 정형화하고, 상기 정형화된 제3 문서 단어 행렬을 이용하여 상기 제3 유사도를 산출하는기술 문서 키워드를 도출하는 장치
|
7 |
7
제6항에 있어서,상기 유사도 산출부는,상기 제1 문서 단어 행렬의 행 값과 열 값을 코사인 거리(cosine distance) 수학식에 적용하여 상기 제1 유사도를 산출하고,상기 제2 문서 단어 행렬의 행 값과 열 값을 상기 코사인 거리(cosine distance) 수학식에 적용하여 상기 제2 유사도를 산출하며,상기 제3 문서 단어 행렬의 행 값과 열 값을 상기 코사인 거리(cosine distance) 수학식에 적용하여 상기 제3 유사도를 산출하는기술 문서 키워드를 도출하는 장치
|
8 |
8
동일한 검색어에 기반하여 수집된 분석 데이터에 포함되는, 학술 문서와 기술 문서의 유사도를 검증하는 유사도 검증부;상기 검증된 유사도가 기준 값보다 높을 경우, 상기 학술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 학술 공통 키워드를 추출하는 학술 키워드 추출부;상기 추출된 적어도 하나 이상의 학술 공통 키워드를 상기 학술 문서의 저자 키워드와 비교하여 키워드 도출 성능을 검증하는 키워드 성능 검증부;상기 기술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 기술 공통 키워드를 추출하는 기술 키워드 추출부; 및상기 추출된 적어도 하나 이상의 기술 공통 키워드를 기술 문서 키워드로 도출하는 기술 문서 키워드 도출부를 포함하고,상기 키워드 성능 검증부는,상기 추출된 적어도 하나 이상의 학술 공통 키워드와 상기 저자 키워드 간의 일치되는 키워드 수를 산출하고, 상기 산출된 키워드 수를 상기 추출된 적어도 하나 이상의 학술 공통 키워드의 수로 나눠서 상기 키워드 도출 성능을 검증하는기술 문서 키워드를 도출하는 장치
|
9 |
9
제8항에 있어서,상기 기술 문서 키워드 도출부는,상기 적어도 하나 이상의 학술 공통 키워드의 개시 빈도에 기초하여 상기 적어도 하나 이상의 학술 공통 키워드의 순위들을 결정하는기술 문서 키워드를 도출하는 장치
|
10 |
10
제9항에 있어서,상기 기술 문서 키워드 도출부는,상기 결정된 순위들에 기초하여 상기 적어도 하나 이상의 학술 공통 키워드 중 노이즈 분류 기준 보다 낮은 순위에 해당하는 학술 공통 키워드를 상기 적어도 하나 이상의 학술 공통 키워드에서 제외하는기술 문서 키워드를 도출하는 장치
|
11 |
11
동일한 검색어에 기반하여 수집된 분석 데이터에 포함되는, 학술 문서와 기술 문서의 유사도를 검증하는 유사도 검증부;상기 검증된 유사도가 기준 값보다 높을 경우, 상기 학술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 학술 공통 키워드를 추출하는 학술 키워드 추출부;상기 추출된 적어도 하나 이상의 학술 공통 키워드를 상기 학술 문서의 저자 키워드와 비교하여 키워드 도출 성능을 검증하는 키워드 성능 검증부;상기 기술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 기술 공통 키워드를 추출하는 기술 키워드 추출부; 및상기 추출된 적어도 하나 이상의 기술 공통 키워드를 기술 문서 키워드로 도출하는 기술 문서 키워드 도출부를 포함하고,상기 학술 문서를 구성하는 복수의 부분은 상기 학술 문서의 요약, 서론 및 결론 중에서 적어도 하나를 포함하며,상기 기술 문서를 구성하는 복수의 부분은 상기 기술 문서의 요약, 서론, 결론, 청구범위 및 제목 중에서 적어도 하나를 포함하는기술 문서 키워드를 도출하는 장치
|
12 |
12
유사도 검증부에서, 동일한 검색어에 기반하여 수집된 분석 데이터에 포함되는, 학술 문서와 기술 문서의 유사도를 검증하는 단계;학술 키워드 추출부에서, 상기 검증된 유사도가 기준 값보다 높을 경우, 상기 학술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 학술 공통 키워드를 추출하는 단계;키워드 성능 검증부에서, 상기 추출된 적어도 하나 이상의 학술 공통 키워드를 상기 학술 문서의 저자 키워드와 비교하여 키워드 도출 성능을 검증하는 단계;기술 키워드 추출부에서, 상기 기술 문서를 구성하는 복수의 부분에서 동일하게 개시되는 적어도 하나 이상의 기술 공통 키워드를 추출하는 단계; 및기술 문서 키워드 도출부에서, 상기 추출된 적어도 하나 이상의 기술 공통 키워드를 기술 문서 키워드로 도출하는 단계를 포함하고,상기 학술 문서와 기술 문서의 유사도를 검증하는 단계는,데이터 분류부에서, 학술 문서 비교 그룹, 기술 문서 비교 그룹 및 학술 및 기술 문서 비교 그룹으로 상기 수집된 분석 데이터를 분류하는 단계;유사도 산출부에서, 상기 학술 문서 비교 그룹에서 학술 문서 간의 제1 유사도를 산출하는 단계;상기 유사도 산출부에서, 상기 기술 문서 비교 그룹에서 기술 문서 간의 제2 유사도를 산출하는 단계; 및상기 유사도 산출부에서, 상기 학술 및 기술 문서 비교 그룹에서 학술 문서와 기술 문서 간의 제3 유사도를 산출하는 단계를 포함하는기술 문서 키워드를 도출하는 방법
|
13 |
13
삭제
|
14 |
14
제12항에 있어서,상기 학술 문서와 기술 문서의 유사도를 검증하는 단계는,상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도의 평균값을 산출하는 단계;상기 산출된 평균값과 상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도 각각을 비교하는 단계;상기 산출된 평균값과 상기 산출된 제1 유사도, 상기 산출된 제2 유사도 및 상기 산출된 제3 유사도 각각의 차이가 기설정된 기준 범위에 상응할 경우, 상기 유사도를 상기 기준 값보다 높은 것으로 검증하는 단계; 및상기 차이가 상기 기준 범위를 벗어날 경우, 상기 유사도를 상기 기준 값보다 낮은 것으로 검증하는 단계를 포함하는기술 문서 키워드를 도출하는 방법
|
15 |
15
제12항에 있어서,상기 제1 유사도를 산출하는 단계는,상기 학술 문서 비교 그룹에서 복수의 학술 문서의 제1 요약을 추출하는 단계;상기 추출된 제1 요약에 대한 텍스트 마이닝을 수행하여 제1 문서 단어 행렬을 정형화하는 단계; 및상기 정형화된 제1 문서 단어 행렬을 이용하여 상기 제1 유사도를 산출하는 단계를 포함하고,상기 제2 유사도를 산출하는 단계는,상기 기술 문서 비교 그룹에서 복수의 기술 문서의 제2 요약을 추출하는 단계;상기 추출된 제2 요약에 대한 텍스트 마이닝을 수행하여 제2 문서 단어 행렬을 정형화하는 단계; 및상기 정형화된 제2 문서 단어 행렬을 이용하여 상기 제2 유사도를 산출하는 단계를 포함하며,상기 제3 유사도를 산출하는 단계는,상기 학술 및 기술 문서 비교 그룹에서 복수의 학술 문서의 제3 요약 및 복수의 기술 문서의 제4 요약을 추출하는 단계;상기 추출된 제3 요약 및 상기 추출된 제4 요약에 대한 텍스트 마이닝을 수행하여 제3 문서 단어 행렬을 정형화하는 단계; 및상기 정형화된 제3 문서 단어 행렬을 이용하여 상기 제3 유사도를 산출하는 단계를 포함하는기술 문서 키워드를 도출하는 방법
|