1 |
1
유사 특허 문서 추천 시스템을 이용한 특허 문서 추천 방법에 있어서,상기 시스템은 분석할 특허 문서를 수집하고, 복수의 유사 특허 문서 분류 모델을 이용하여 분류하는 단계;분류 결과를 이용하여 특허 문서의 분류 적합 기준에 따라 복수의 분류 모델 중 사용할 모델을 선택하는 단계;선택된 모델을 이용하여 문서 유사도를 분석하는 단계;분석된 유사 특허 문서를 추천하는 단계;를 포함하되,상기 문서 유사도를 분석하는 단계는가중치에 따라 문서 유사도를 분석하는 단계;를 더 포함하며, 상기 사용할 모델을 선택하는 단계에서,모델 선택 시 파라미터 값을 선택하며,상기 파라미터는상기 특허 문서의 문장 내에서 현재 단어와 예측 단어 사이의 최대 거리를 나타내며, 모델 학습 시 주변단어의 개수를 몇 개까지 고려할지를 의미하는 파라미터를 포함하며, 상기 가중치는상기 특허 문서의 특성상 명칭(Title), 초록(Abstract), 청구항(Claims)에 따른 중요도를 기준으로 한 비율에 따라 차등 적용되며, 상기 선택된 모델은Word2vec 모델, LDA 모델 또는 Word2vec과 LDA을 통합한 모델 중 어느 하나인 것을 특징으로 하는 유사 특허 문서 추천 방법
|
2 |
2
제1항에 있어서,상기 분류 적합 기준은관련있는 모든 문서를 잘 찾아내는가를 의미하는 재현율(recall)과 모델이 찾은 문서 중 관련된 문서가 얼마나 있는가를 의미하는 정밀도(precision)를 기준으로 하는 것을 특징으로 하는 유사 특허 문서 추천 방법
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
삭제
|
7 |
7
분석할 특허 문서를 수집하고, 복수의 유사 특허 문서 분류 모델을 이용하여 분류하는 데이터처리부;분류 결과를 이용하여 특허 문서의 분류 적합 기준에 따라 복수의 분류 모델 중 사용할 모델을 선택하는 모델선택부;선택된 모델을 이용하여 문서 유사도를 분석하고, 분석된 유사 특허 문서를 추천하는 유사분석부;상기 유사분석부에서 가중치에 따라 문서 유사도를 분석하기 위한 가중치를 제공하는 가중치산출부;를 포함하며,상기 사용할 모델을 선택 시 파라미터 값을 선택하며,상기 파라미터는상기 특허 문서의 문장 내에서 현재 단어와 예측 단어 사이의 최대 거리를 나타내며, 모델 학습 시 주변단어의 개수를 몇 개까지 고려할지를 의미하는 파라미터를 포함하며,상기 가중치는상기 특허 문서의 특성상 명칭(Title), 초록(Abstract), 청구항(Claims)에 따른 중요도를 기준으로 한 비율에 따라 차등 적용되며,상기 선택된 모델은Word2vec 모델, LDA 모델 또는 Word2vec과 LDA을 통합한 모델 중 어느 하나인 것을 특징으로 하는 유사 특허 문서 추천 시스템
|
8 |
8
삭제
|
9 |
9
삭제
|
10 |
10
제7항에 있어서,상기 분류 적합 기준은관련있는 모든 문서를 잘 찾아내는가를 의미하는 재현율(recall)과 모델이 찾은 문서 중 관련된 문서가 얼마나 있는가를 의미하는 정밀도(precision)를 기준으로 하는 것을 특징으로 하는 유사 특허 문서 추천 시스템
|
11 |
11
삭제
|