1 |
1
전자 계산기에 의해 수행되는 데이터 압축방법으로서, 상기 전자계산기가,데이터 행렬을, 서로 곱하면 상기 데이터 행렬로 근사되는 두 개의 모델 행렬로 분할하는 단계;상기 두 개의 모델 행렬 각각에 대하여, 원소들을 클러스터링하여, 상기 원소들이 속하는 K(K는 자연수)개의 클러스터를 생성하는 단계;상기 두 개의 모델 행렬의 각 원소들을 각자가 속한 클러스터 값으로 대체하는 단계;상기 클러스터의 값들을 따로 배열에 저장하고, 상기 두 개의 모델 행렬의 각 원소에 그 배열의 인덱스를 저장하는 단계; 및상기 두 개의 모델 행렬의 원소의 크기를 상기 K개의 인덱스를 저장하기에 필요한 최소 크기로 만들어 상기 두 개의 모델 행렬의 크기를 축소시키는 단계;를 포함하는 데이터 압축방법
|
2 |
2
제1 항에 있어서,상기 두 개의 모델 행렬로 분할하는 단계에서,상기 두 개의 모델 행렬은,,(이 식에서, Ω는 관측된 행렬원소의 인덱스 쌍의 집합, A는 m x n의 데이터 행렬, k는 n보다 작은 자연수, W, H는 두 개의 모델 행렬임)의 수학식을 만족하는 것을 특징으로 하는 데이터 압축방법
|
3 |
3
제2 항에 있어서,상기 두 개의 모델 행렬은,ALS(Alternating Least Squares), SGD(Stochastic Gradient Descent), CCD(Cyclic Coordinate Descent) 중, 어느 하나를 통해서 구해지는 것을 특징으로 하는 데이터 압축방법
|
4 |
4
제1 항에 있어서,상기 두 개의 모델 행렬 각각에 대하여, N개의 모델 행렬의 원소들을 클러스터링하여, 상기 원소들이 속하는 K(K는 자연수)개의 클러스터를 생성하는 단계는, (이 식에서, μk는 클러스터, Xn은 모델 행렬의 원소값들의 집합, rnk는, n번째 샘플 Xn이 k번째 클러스터에 속하는 경우 1이고, 그렇지 않은 경우 0)의 식에서 J값을 최소로 하는 클러스터 μk 값을 구하는 것을 특징으로 하는 데이터 압축방법
|
5 |
5
제4 항에 있어서,상기 J값을 최소로 하는 클러스터 μk 값을 구하기 위해서,(a) 초기의 μk 값을 설정하는 단계;(b) μk 값을 고정하고, J값을 최소화하는 rnk 값을 구하는 단계;(c) rnk 값을 고정하고, J값을 최소화하는 μk 값을 구하는 단계; 및(d) 위의 (b) 및 (c) 단계를 반복하는 단계;를 수행하는 것을 특징으로 하는 데이터 압축방법
|
6 |
6
제5 항에 있어서,상기 (d) 단계는,rnk 값 및 μk 값이 설정된 범위내로 수렴할 때까지 수행하는 것을 특징으로 하는 데이터 압축방법
|
7 |
7
제5 항에 있어서,상기 (d) 단계는,설정된 반복횟수 만큼 수행하는 것을 특징으로 하는 데이터 압축방법
|
8 |
8
제5 항에 있어서,상기 (a) 단계에서,상기 초기의 μk 값은, 모델 행렬의 원소의 크기의 최대값과 최소값을 연결하는 직선을 등간격으로 (K-1)등분하고, 등간격으로 나뉘어진 K개의 값을 이용하는 것을 특징으로 하는 데이터 압축방법
|
9 |
9
데이터 행렬을, 서로 곱하면 상기 데이터 행렬로 근사되는 두 개의 모델 행렬로 분할하는 행렬 분할기;상기 두 개의 모델 행렬 각각에 대하여, 원소들을 클러스터링하여, 상기 원소들이 속하는 K(K는 자연수)개의 클러스터를 생성하는 클러스터 생성기;상기 두 개의 모델 행렬의 각 원소들을 각자가 속한 클러스터 값으로 대체하는 처리기; 및상기 클러스터의 값들을 따로 배열에 저장하고, 상기 두 개의 모델 행렬의 각 원소에 그 배열의 인덱스를 저장하는 메모리;를 포함하는 데이터 압축장치
|
10 |
10
제9 항에 있어서,상기 행렬 분할기는,아래의 수학식에서 m x n 데이터 행렬 A를,,(Ω는 관측된 행렬원소의 인덱스 쌍의 집합, k는 n보다 작은 자연수)의 수학식을 만족하는 두 개의 모델 행렬 W, H로 분할하는 것을 특징으로 하는 데이터 압축장치
|
11 |
11
제10 항에 있어서,상기 두 개의 모델 행렬 W, H는,ALS(Alternating Least Squares), SGD(Stochastic Gradient Descent), CCD(Cyclic Coordinate Descent) 중, 어느 하나를 통해서 구해지는 것을 특징으로 하는 데이터 압축장치
|
12 |
12
제9 항에 있어서,상기 클러스터 생성기는,(이 식에서, N은 모델 행렬의 원소들의 수, K값은 클러스터의 수, μk는 클러스터, Xn은 모델 행렬의 원소값들의 집합, rnk는, n번째 샘플 Xn이 k번째 클러스터에 속하는 경우 1이고, 그렇지 않은 경우 0)의 식에서 J값을 최소로 하는 클러스터 μk 값을 생성하는 것을 특징으로 하는 데이터 압축장치
|
13 |
13
제12 항에 있어서,상기 클러스터 생성기는,상기 J값을 최소로 하는 클러스터 μk 값을 구하기 위해서,(a) 초기의 μk 값을 설정하는 단계;(b) μk 값을 고정하고, J값을 최소화하는 rnk 값을 구하는 단계;(c) rnk 값을 고정하고, J값을 최소화하는 μk 값을 구하는 단계; 및(d) 위의 (b) 및 (c) 단계를 반복하는 단계;를 수행하는 것을 특징으로 하는 데이터 압축장치
|
14 |
14
제13 항에 있어서,상기 클러스터 생성기는,rnk 값 및 μk 값이 설정된 범위내로 수렴할 때까지 상기 (d) 단계를 수행하는 것을 특징으로 하는 데이터 압축장치
|
15 |
15
제13 항에 있어서,상기 클러스터 생성기는,설정된 반복횟수 만큼 상기 (d) 단계를 수행하는 것을 특징으로 하는 데이터 압축장치
|
16 |
16
제13 항에 있어서,상기 클러스터 생성기는,상기 (a) 단계에서,상기 초기의 μk 값은, 모델 행렬의 원소의 크기의 최대값과 최소값을 연결하는 직선을 등간격으로 (K-1)등분하고, 등간격으로 나뉘어진 K개의 값을 이용하는 것을 특징으로 하는 데이터 압축장치
|