1 |
1
빅데이터 분석을 위한 시장 세분화 반딧불 알고리즘(Firefly algorithm; FA) 방법에 있어서,최근 거래 데이터(Recency; R), 거래 횟수 데이터(Frequency; F) 및 거래 대금 크기 데이터(Monetary; M)를 포함하는 시장 데이터를 수집 및 전처리(preprocessing)하는 단계;상기 RFM을 포함하는 복수의 시장 데이터들의 특징값과 가중치를 산출하는 단계;상기 복수의 시장 데이터들 사이의 거리 및 거리의 상대적 비율을 산출하여 초기 해를 생성하고, 상기 초기 해에 대한 실루엣 평가값을 산출하여 적합 클러스터 수(K)를 결정하는 단계;상기 시장 세분화 반딧불 알고리즘을 이용하여 상기 적합 클러스터 수에서의 최적해를 획득하는 단계; 및상기 최적해를 참조하여 상기 시장 데이터를 복수의 클러스터들로 최종 클러스터링하는 단계를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
2 |
2
제1항에 있어서,상기 최적해를 획득하는 단계는상기 상대적 비율에 반비례하는 확률과 상기 적합 클러스터 수의 데이터 중심 간의 거리에 의한 중심 데이터를 결정하는 단계;상기 적합 클러스터 수의 상기 중심 데이터를 기반으로 상기 복수의 시장 데이터들을 클러스터링하여 클러스터링 해를 생성하는 단계;상기 클러스터링 해에 대해 이웃 유인(Neighborhood-Attraction) 기법 및 풀 유인(Full-Attraction) 기법을 적용하여 최적해를 탐색하는 단계; 및 동일한 해의 발생에 따라, 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하여 새로운 영역 및 새로운 해를 탐색하는 단계를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
3 |
3
제2항에 있어서,상기 중심 데이터를 결정하는 단계는상기 복수의 시장 데이터들 중 상기 복수의 시장 데이터들 각각으로부터의 상기 거리의 상대적 비율이 가장 작은 어느 하나의 데이터를 복수의 클러스터들 중 제1 클러스터의 중심 데이터로 선택하는 단계; 및상기 제1 클러스터를 제외한 나머지 클러스터들 각각에 대해, 상기 제1 클러스터를 포함하는 모든 클러스터의 선택된 모든 중심 데이터로부터의 거리 및 상기 복수의 시장 데이터들 각각으로부터의 거리의 상대적 비율과 관련된 평가함수를 최소화하는 데이터를 중심 데이터로 선택하는 단계를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
4 |
4
제3항에 있어서,상기 클러스터링 해를 생성하는 단계는상기 적합 클러스터 수에 따라, 상기 복수의 클러스터들 각각의 중심 데이터를 기준으로 상기 복수의 시장 데이터들을 클러스터링하여 상기 클러스터링 해를 생성하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
5 |
5
제2항에 있어서,상기 최적해를 탐색하는 단계는초기에 상기 이웃 유인 기법을 적용하여 해 탐색하고, 탐색 후 탐색 범위가 좁아지면 말기에 상기 풀 유인 기법을 적용하여 상기 최적해를 탐색하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
6 |
6
제5항에 있어서,상기 최적해를 탐색하는 단계는상기 복수의 시장 데이터들에 클러스터 내부 거리(intra-cluster distance) 수식을 적용하여 산출되는 클러스터 내부 거리 평가값이 기 설정된 종료 조건에 부합하거나, 기 설정된 시간 범위에 충족할 때, 상기 시장 세분화 반딧불 알고리즘(Firefly Algorithm; FA)을 종료하여 상기 최적해를 도출하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
7 |
7
제2항에 있어서,상기 새로운 영역 및 새로운 해를 탐색하는 단계는상기 탐색된 최적해에서 동일한 해가 발생되는 경우, 상기 중심 데이터를 결정하는 단계 및 상기 클러스터링 해를 생성하는 단계를 통해 상기 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하여 다양한 해 탐색을 추구하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
8 |
8
제1항에 있어서,상기 복수의 시장 데이터들의 특징값과 가중치를 산출하는 단계는상기 복수의 시장 데이터들에 대한 타겟 고객(target customer, most profitable customer)의 점수를 통해 상기 시장 데이터의 특징값을 결정하고, 마케팅 전략과 상품에 따른 상기 타겟 고객의 기준값으로 상기 시장 데이터의 가중치를 결정하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
9 |
9
제1항에 있어서,상기 적합 클러스터 수(K)를 결정하는 단계는상기 복수의 시장 데이터들 중 p차원 특징을 나타내는 제i 데이터에서 제j 데이터까지의 거리(dij)를 산출하여 저장하는 단계;상기 산출된 제i 데이터에서 제j 데이터까지의 거리(dij)의 합에서, 상기 복수의 시장 데이터들에 대한 상기 제j 데이터까지의 거리의 상대적 비율(Vj)을 산출하는 단계;상기 산출된 상대적 비율을 확률적으로 적용하여 상기 복수의 시장 데이터들에 대한 상기 초기 해를 생성하는 단계;상기 초기 해에 대한 상기 실루엣 평가값을 산출하는 단계; 및상기 실루엣 평가값에 기반하여 상기 적합 클러스터 수(K)를 획득하는 단계를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
10 |
10
제9항에 있어서,상기 거리의 상대적 비율을 산출하는 단계는복수의 시장 데이터들 간 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하며,상기 초기 해를 생성하는 단계는상기 산출된 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 적용하여 상기 초기 해를 생성하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 방법
|
11 |
11
빅데이터 분석을 위한 시장 세분화 반딧불 알고리즘(Firefly algorithm; FA) 방법을 실행시키기 위해 컴퓨터로 읽을 수 있는 매체에 저장된 컴퓨터 프로그램에 있어서,최근 거래 데이터(Recency; R), 거래 횟수 데이터(Frequency; F) 및 거래 대금 크기 데이터(Monetary; M)를 포함하는 시장 데이터를 수집 및 전처리(preprocessing)하는 단계;상기 RFM을 포함하는 복수의 시장 데이터들의 특징값과 가중치를 산출하는 단계;상기 복수의 시장 데이터들 사이의 거리 및 거리의 상대적 비율을 산출하여 초기 해를 생성하고, 상기 초기 해에 대한 실루엣 평가값을 산출하여 적합 클러스터 수(K)를 결정하는 단계;상기 시장 세분화 반딧불 알고리즘을 이용하여 상기 적합 클러스터 수에서의 최적해를 획득하는 단계; 및상기 최적해를 참조하여 상기 시장 데이터를 복수의 클러스터들로 최종 클러스터링하는 단계를 포함하는 매체에 저장된 컴퓨터 프로그램
|
12 |
12
복수의 시장 데이터들에 대한 제i 데이터에서 제j 데이터까지의 거리의 상대적 비율(Vj)을 산출하는 단계;상기 상대적 비율을 확률적으로 적용하여 획득되는 상기 복수의 시장 데이터들에 대한 실루엣 평가값에 따라 적합 클라스터 수(K)를 획득하는 단계;상기 상대적 비율에 반비례하는 확률과 상기 적합 클러스터 수의 데이터 중심 간의 거리에 의한 중심 데이터를 결정하는 단계;상기 적합 클러스터 수의 상기 중심 데이터를 기반으로 상기 복수의 시장 데이터들을 클러스터링하여 클러스터링 해를 생성하는 단계;상기 클러스터링 해에 대해 이웃 유인(Neighborhood-Attraction) 기법 및 풀 유인(Full-Attraction) 기법을 적용하여 최적해를 탐색하는 단계; 및 동일한 해의 발생에 따라, 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하여 새로운 영역 및 새로운 해를 탐색하는 단계를 포함하는 시장 세분화 반딧불 알고리즘
|
13 |
13
빅데이터 분석을 위한 시장 세분화 반딧불 알고리즘(Firefly algorithm; FA) 시스템에 있어서,최근 거래 데이터(Recency; R), 거래 횟수 데이터(Frequency; F) 및 거래 대금 크기 데이터(Monetary; M)를 포함하는 시장 데이터를 수집 및 전처리(preprocessing)하는 수집부;상기 RFM을 포함하는 복수의 시장 데이터들의 특징값과 가중치를 산출하는 산출부;상기 복수의 시장 데이터들 사이의 거리 및 거리의 상대적 비율을 산출하여 초기 해를 생성하고, 상기 초기 해에 대한 실루엣 평가값을 산출하여 적합 클러스터 수(K)를 결정하는 결정부;상기 시장 세분화 반딧불 알고리즘을 이용하여 상기 적합 클러스터 수에서의 최적해를 획득하는 획득부; 및상기 최적해를 참조하여 상기 시장 데이터를 복수의 클러스터들로 최종 클러스터링하는 클러스터링부를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
14 |
14
제13항에 있어서,상기 획득부는상기 상대적 비율에 반비례하는 확률과 상기 적합 클러스터 수의 데이터 중심 간의 거리에 의한 중심 데이터를 결정하는 중심 데이터 결정부;상기 적합 클러스터 수의 상기 중심 데이터를 기반으로 상기 복수의 시장 데이터들을 클러스터링하여 클러스터링 해를 생성하는 해 생성부;상기 클러스터링 해에 대해 이웃 유인(Neighborhood-Attraction) 기법 및 풀 유인(Full-Attraction) 기법을 적용하여 최적해를 탐색하는 최적해 탐색부; 및 동일한 해의 발생에 따라, 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하여 새로운 영역 및 새로운 해를 해 탐색부를 포함하는 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
15 |
15
제14항에 있어서,상기 중심 데이터 결정부는상기 복수의 시장 데이터들 중 상기 복수의 시장 데이터들 각각으로부터의 상기 거리의 상대적 비율이 가장 작은 어느 하나의 데이터를 복수의 클러스터들 중 제1 클러스터의 중심 데이터로 선택하고, 상기 제1 클러스터를 제외한 나머지 클러스터들 각각에 대해, 상기 제1 클러스터를 포함하는 모든 클러스터의 선택된 모든 중심 데이터로부터의 거리 및 상기 복수의 시장 데이터들 각각으로부터의 거리의 상대적 비율과 관련된 평가함수를 최소화하는 데이터를 중심 데이터로 선택하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
16 |
16
제15항에 있어서,상기 해 생성부는상기 적합 클러스터 수에 따라, 상기 복수의 클러스터들 각각의 중심 데이터를 기준으로 상기 복수의 시장 데이터들을 클러스터링하여 상기 클러스터링 해를 생성하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
17 |
17
제14항에 있어서,상기 최적해 탐색부는초기에 상기 이웃 유인 기법을 적용하여 해 탐색하고, 탐색 후 탐색 범위가 좁아지면 말기에 상기 풀 유인 기법을 적용하여 상기 최적해를 탐색하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
18 |
18
제17항에 있어서,상기 최적해 탐색부는상기 복수의 시장 데이터들에 클러스터 내부 거리(intra-cluster distance) 수식을 적용하여 산출되는 클러스터 내부 거리 평가값이 기 설정된 종료 조건에 부합하거나, 기 설정된 시간 범위에 충족할 때, 상기 시장 세분화 반딧불 알고리즘(Firefly Algorithm; FA)을 종료하여 상기 최적해를 도출하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
19 |
19
제14항에 있어서,상기 해 탐색부는상기 탐색된 최적해에서 동일한 해가 발생되는 경우, 상기 중심 데이터를 결정하는 단계 및 상기 클러스터링 해를 생성하는 단계를 통해 상기 상대적 비율 및 클러스터의 중심 데이터 간의 거리(UVj)를 산출하여 다양한 해 탐색을 추구하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|
20 |
20
제13항에 있어서,상기 결정부는상기 복수의 시장 데이터들 중 p차원 특징을 나타내는 제i 데이터에서 제j 데이터까지의 거리(dij)를 산출하여 저장하고, 상기 산출된 제i 데이터에서 제j 데이터까지의 거리(dij)의 합에서, 상기 복수의 시장 데이터들에 대한 상기 제j 데이터까지의 거리의 상대적 비율(Vj)을 산출하며, 상기 산출된 상대적 비율을 확률적으로 적용하여 상기 복수의 시장 데이터들에 대한 상기 초기 해를 생성하고, 상기 초기 해에 대한 상기 실루엣 평가값을 산출하여 상기 적합 클러스터 수(K)를 획득하는 것을 특징으로 하는, 반딧불 알고리즘을 이용한 데이터 세분화 시스템
|