1 |
1
다수의 문서를 저장하는 데이터베이스를 구비한 서버와 네트워크를 통하여 연결되는 컴퓨터 시스템을 이용하는 문서 그룹화 시스템에 있어서,상기 서버에 그룹화할 문서를 요청하여 다수의 문서를 전송받는 요청수단;전송받은 상기 다수의 문서를 구문분석하여 다차원 벡터를 생성하는 벡터수단;생성된 상기 다차원 벡터와 상기 문서가 갖고 있는 다수의 문서정보를 이용하여 상기 다수의 문서를 클러스터링하는 클러스터링수단;클러스터링된 다수의 클러스터와 상기 클러스터에 속한 상기 다수의 문서를 시각화하기 위한 정보를 산출하는 시각화수단;산출된 시각화 정보를 이용하여 상기 클러스터와 상기 다수의 문서를 출력하는 출력수단을 포함하는 것을 특징으로 하는 신성장분야에 최적화된 딥러닝을 이용한 특허 분류시스템
|
2 |
2
제 1항에 있어서,상기 클러스터링수단은상기 다수의 문서에 포함된 각각의 단어를 수집하되, 단어가 수집된 횟수를 기준으로 정규분포로 변환을 진행하며,상기 정규분포 변환이 진행된 단어 중 z값이 2이상에 해당하는 단어의 경우 키워드로 설정하며,각각의 카테고리와 상기 키워드 간에 유사도는,sim(A) = {simcos(a, A), simcos(b, A), simcos(c,A),
|
3 |
3
제2항에 있어서,상기 클러스터링수단은,REF(AA) = {val(a,AA), val(b,AA}, val(c,AA),…여기서, AA는 분류가 필요한 문서이고, var(a, AA)는 a키워드가 문서AA에 포함되었는지 여부이며, REF(AA)는 각각의 키워드가 AA문서에 포함되었는지 여부를 행렬로 나타낸 포함행렬이며,REF(AA) 와 sim(A)의 내적을 통해 AA문서의 카테고리를 결정하는 신성장분야에 최적화된 딥러닝을 이용한 특허 분류시스템
|
4 |
4
다수의 문서를 저장하는 데이터베이스를 구비한 서버와 네트워크를 통하여 연결되는 컴퓨터 시스템을 이용하는 문서 그룹화 방법에 있어서,상기 서버에 그룹화할 문서를 요청하여 다수의 문서를 전송받는 단계;전송받은 상기 다수의 문서를 구문분석하여 다차원 벡터를 생성하는 단계;생성된 상기 다차원 벡터와 상기 문서가 갖고 있는 다수의 문서정보를 이용하여 상기 다수의 문서를 클러스터링하는 단계;클러스터링된 다수의 클러스터와 상기 클러스터에 속한 상기 다수의 문서를 시각화하기 위한 정보를 산출하는 단계; 및산출된 시각화 정보를 이용하여 상기 클러스터와 상기 다수의 문서를 출력하는 단계를 포함하는 것을 특징으로 하는 신성장분야에 최적화된 딥러닝을 이용한 특허 분류방법
|
5 |
5
제 4항에 있어서,상기 클러스터링하는 단계는,상기 다수의 문서에 포함된 각각의 단어를 수집하되, 단어가 수집된 횟수를 기준으로 정규분포로 변환을 진행하는 단계;상기 정규분포 변환이 진행된 단어 중 z값이 2이상에 해당하는 단어의 경우 키워드로 설정하는 단계 및상기 두 문서의 유사도를 식sim(A) = {simcos(a, A), simcos(b, A), simcos(c,A),
|
6 |
6
제5항에 있어서,상기 클러스터링하는 단계는,상기 키워드가 문서에 포함되었는지 여부를 아래식을 통해 행렬로 표현하며,REF(AA) = {val(a,AA), val(b,AA}, val(c,AA),…여기서, AA는 분류가 필요한 문서이고, var(a, AA)는 a키워드가 문서AA에 포함되었는지 여부이며, REF(AA)는 각각의 키워드가 AA문서에 포함되었는지 여부를 행렬로 나타낸 포함행렬이며,REF(AA) 와 sim(A)의 내적을 통해 AA문서의 카테고리를 결정하는 신성장분야에 최적화된 딥러닝을 이용한 특허 분류방법
|