1 |
1
소프트웨어 클러스터링 장치에서 수행하는 소프트웨어 클러스터링 방법으로서,복수의 소프트웨어로부터 추출한 복수의 버스마크(birthmark)가 포함된 데이터를 생성하는 단계와,상기 데이터에 대한 텍스트 마이닝(text mining)을 통해 상기 복수의 버스마크에게 가중치를 부여하는 단계와,상기 복수의 버스마크를 대상으로 하여, 상기 가중치가 적용된 출현 빈도에 따라 숫자 벡터로 변환하는 벡터화를 수행하여 행렬로 표현하는 단계와,상기 행렬로 표현된 데이터를 기초로 한 특정 개수의 범주를 사용하여 상기 복수의 소프트웨어를 클러스터링하는 단계를 포함하는소프트웨어 클러스터링 방법
|
2 |
2
제 1 항에 있어서,상기 가중치를 부여하는 단계는,상기 복수의 버스마크 중 다수의 상기 소프트웨어에서 공통적으로 이용되는 버스마크에게 다른 버스마크보다 상기 가중치를 상대적으로 더 낮게 부여하는소프트웨어 클러스터링 방법
|
3 |
3
제 1 항에 있어서,상기 소프트웨어로부터 API(Application Programming Interface) 정보를 추출하여 상기 버스마크로 정의하는소프트웨어 클러스터링 방법
|
4 |
4
제 1 항에 있어서,상기 가중치의 부여와 상기 벡터화 및 상기 클러스터링을 위해 scikit-learn 라이브러리를 활용한 기계학습을 하는소프트웨어 클러스터링 방법
|
5 |
5
제 1 항에 있어서,TF-IDF(Term Frequency-Inverse Document Frequency)를 적용하여 상기 가중치를 부여하는소프트웨어 클러스터링 방법
|
6 |
6
제 5 항에 있어서,상기 TF-IDF의 적용 및 상기 벡터화를 위해 scikit-learn 라이브러리의 TfidfVectorizer 모듈을 사용하는소프트웨어 클러스터링 방법
|
7 |
7
제 1 항에 있어서,상기 벡터화를 수행하여 표현된 행렬이 상기 클러스터링에 사용되기 전에 제로 요소를 제거하여 희소행렬에서 밀집행렬로 변환하는 단계를 더 포함하는소프트웨어 클러스터링 방법
|
8 |
8
제 1 항에 있어서,상기 벡터화를 수행하여 표현된 행렬이 상기 클러스터링에 사용되기 전에 특이값 분해(Singular Value Decomposition, SVD)를 이용하여 축소하는 단계를 더 포함하는소프트웨어 클러스터링 방법
|
9 |
9
제 8 항에 있어서,상기 특이값 분해를 위해 scikit-learn 라이브러리의 TruncatedSVD 모듈을 사용하는소프트웨어 클러스터링 방법
|
10 |
10
제 1 항에 있어서,상기 클러스터링을 위해 scikit-learn 라이브러리의 Kmeans 모듈이나, 가우시안 혼합모델(Gaussian Mixture Model(GMM), Mixture of Gaussian)을 사용하는소프트웨어 클러스터링 방법
|
11 |
11
제 1 항 내지 제 10 항 중 어느 한 항의 소프트웨어 클러스터링 방법을 프로세서가 수행하도록 하기 위하여컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
|
12 |
12
제 1 항 내지 제 10 항 중 어느 한 항의 소프트웨어 클러스터링 방법을 프로세서가 수행하도록 하는컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체
|
13 |
13
복수의 소프트웨어로부터 추출한 복수의 버스마크(birthmark)가 포함된 데이터를 생성하는 데이터 생성부와,상기 데이터에 대한 텍스트 마이닝(text mining)을 통해 상기 복수의 버스마크에게 가중치를 부여하고, 상기 복수의 버스마크를 대상으로 하여, 상기 가중치가 적용된 출현 빈도에 따라 숫자 벡터로 변환하는 벡터화를 수행하여 행렬로 표현하는 분석부와,상기 행렬로 표현된 데이터를 기초로 한 특정 개수의 범주를 사용하여 상기 복수의 소프트웨어를 클러스터링하는 처리부를 포함하는소프트웨어 클러스터링 장치
|
14 |
14
제 13 항에 있어서,상기 분석부는, 상기 복수의 버스마크 중 다수의 상기 소프트웨어에서 공통적으로 이용되는 버스마크에게 다른 버스마크보다 상기 가중치를 상대적으로 더 낮게 부여하는소프트웨어 클러스터링 장치
|
15 |
15
제 13 항에 있어서,상기 소프트웨어로부터 API(Application Programming Interface) 정보를 추출하여 상기 버스마크로 정의하는소프트웨어 클러스터링 장치
|
16 |
16
제 13 항에 있어서,상기 가중치의 부여와 상기 벡터화 및 상기 클러스터링을 위해 scikit-learn 라이브러리를 활용한 기계학습을 하는소프트웨어 클러스터링 장치
|
17 |
17
제 13 항에 있어서,TF-IDF(Term Frequency-Inverse Document Frequency)를 적용하여 상기 가중치를 부여하는소프트웨어 클러스터링 장치
|
18 |
18
제 17 항에 있어서,상기 TF-IDF의 적용 및 상기 벡터화를 위해 scikit-learn 라이브러리의 TfidfVectorizer 모듈을 사용하는소프트웨어 클러스터링 장치
|
19 |
19
제 13 항에 있어서,상기 분석부는, 상기 벡터화를 수행하여 표현된 행렬이 상기 클러스터링에 사용되기 전에 제로 요소를 제거하여 희소행렬에서 밀집행렬로 변환하는소프트웨어 클러스터링 장치
|
20 |
20
제 13 항에 있어서,상기 분석부는, 상기 벡터화를 수행하여 표현된 행렬이 상기 클러스터링에 사용되기 전에 특이값 분해(Singular Value Decomposition, SVD)를 이용하여 축소하는소프트웨어 클러스터링 장치
|
21 |
21
제 20 항에 있어서,상기 특이값 분해를 위해 scikit-learn 라이브러리의 TruncatedSVD 모듈을 사용하는소프트웨어 클러스터링 장치
|
22 |
22
제 13 항에 있어서,상기 클러스터링을 위해 scikit-learn 라이브러리의 Kmeans 모듈이나, 가우시안 혼합모델(Gaussian Mixture Model(GMM), Mixture of Gaussian)을 사용하는소프트웨어 클러스터링 장치
|