1 |
1
SIMD 기반의 신경망 프루닝 방법에 있어서,신경망 내 레이어에 적용되는 노드 간 가중치 커널을 GEMM 변환하는 단계; 및상기 GEMM 변환된 가중치 커널을 기 설정된 SIMD 너비를 단위로 하여 프루닝하는 단계,를 포함하는, 신경망 프루닝 방법
|
2 |
2
제1항에 있어서,상기 프루닝 하는 단계는,상기 GEMM 변환된 가중치 커널을 상기 SIMD 너비를 고려하여 복수의 단위 벡터로 분할하는 단계;분할된 상기 단위 벡터 각각의 크기값을 계산하는 단계; 및상기 크기값이 기 설정된 문턱값보다 작은 상기 단위 벡터를 상기 GEMM 변환된 가중치 커널로부터 제거하는 단계,를 포함하는 것인, 신경망 프루닝 방법
|
3 |
3
제2항에 있어서,상기 GEMM 변환된 가중치 커널로부터 제거하는 단계는,상기 GEMM 변환된 가중치 커널에 대하여 기 설정된 소정의 방향을 따라 상기 단위 벡터를 탐색하면서 상기 단위 벡터의 크기값과 상기 기 설정된 문턱값을 비교하는 단계를 포함하는 것인, 신경망 프루닝 방법
|
4 |
4
제3항에 있어서,SIMD 기능을 구비한 CPU에 의해 수행되는 것을 특징으로 하고,상기 SIMD 너비는 상기 CPU의 SIMD 처리 능력에 기초하여 결정되는 것인, 신경망 프루닝 방법
|
5 |
5
제4항에 있어서,상기 SIMD 너비는,상기 GEMM 변환된 가중치 커널의 4개 내지 8개 중 어느 한 개수의 연속된 셀을 포함하도록 결정되는 것인, 신경망 프루닝 방법
|
6 |
6
제1항에 있어서,상기 프루닝된 신경망 내의 노드 간 가중치 커널 중 적어도 일부를 회복시키고, 상기 회복된 노드 간 가중치 커널에 대한 재훈련을 수행하는 단계를 더 포함하는 것인, 신경망 프루닝 방법
|
7 |
7
상이한 희소 수준을 갖는 신경망 다중 프루닝 방법에 있어서,신경망 내 레이어 중 어느 하나에 대하여 커널 단위의 조립 수준 프루닝을 수행하는 단계; 및상기 조립 수준 프루닝 수행 결과에 대하여 SIMD 단위의 세립 수준 프루닝을 수행하는 단계,를 포함하는, 신경망 다중 프루닝 방법
|
8 |
8
제7항에 있어서,상기 세립 수준 프루닝을 수행하는 단계는,상기 조립 수준 프루닝 수행 결과에 대한 가중치 커널을 GEMM 변환하는 단계; 및상기 GEMM 변환된 가중치 커널을 기 설정된 SIMD 너비를 단위로 하여 프루닝하는 단계,를 포함하는 것인, 신경망 다중 프루닝 방법
|
9 |
9
제8항에 있어서,상기 SIMD 너비를 단위로 하여 프루닝하는 단계는,상기 GEMM 변환된 가중치 커널을 상기 SIMD 너비를 단위로 하는 복수의 단위 벡터로 분할하는 단계;분할된 상기 단위 벡터 각각의 크기값을 계산하는 단계; 및상기 크기값이 기 설정된 문턱값보다 작은 상기 단위 벡터를 상기 GEMM 변환된 가중치 커널로부터 제거하는 단계,를 포함하는 것인, 신경망 다중 프루닝 방법
|
10 |
10
제7항에 있어서,상기 조립 수준 프루닝을 수행하는 단계는,GEMM 변환되지 않은 원본 가중치 커널의 적어도 일부의 연속적인 영역을 상기 원본 가중치 커널로부터 제거하는 것인, 신경망 다중 프루닝 방법
|
11 |
11
제7항에 있어서,상기 프루닝된 신경망 내의 노드 간 가중치 커널 중 적어도 일부를 회복시키고, 상기 회복된 노드 간 가중치 커널에 대한 재훈련을 수행하는 단계를 더 포함하는 것인, 신경망 다중 프루닝 방법
|
12 |
12
상이한 희소 수준을 갖는 신경망 다중 프루닝 장치에 있어서,신경망 내 레이어 중 어느 하나에 대하여 커널 단위의 조립 수준 프루닝을 수행하는 제1프루닝부; 및상기 조립 수준 프루닝 수행 결과에 대하여 SIMD 단위의 세립 수준 프루닝을 수행하는 제2프루닝부,를 포함하는, 다중 프루닝 장치
|
13 |
13
제12항에 있어서,상기 제2프루닝부는,상기 조립 수준 프루닝 수행 결과에 대한 가중치 커널을 GEMM 변환하고, 상기 GEMM 변환된 가중치 커널을 기 설정된 SIMD 너비를 단위로 하여 프루닝하는 것인, 다중 프루닝 장치
|
14 |
14
제13항에 있어서,상기 제2프루닝부는,상기 GEMM 변환된 가중치 커널을 상기 SIMD 너비를 단위로 하는 복수의 단위 벡터로 분할하고, 분할된 상기 단위 벡터 각각의 크기값을 계산하고, 상기 크기값이 기 설정된 문턱값보다 작은 상기 단위 벡터를 상기 GEMM 변환된 가중치 커널로부터 제거하는 것인, 다중 프루닝 장치
|
15 |
15
제12항에 있어서,상기 제1프루닝부는,GEMM 변환되지 않은 원본 가중치 커널의 적어도 일부의 연속적인 영역을 상기 원본 가중치 커널로부터 제거하는 것인, 다중 프루닝 장치
|
16 |
16
제14항에 있어서,프루닝된 신경망 내의 노드 간 가중치 커널 중 적어도 일부를 회복시키고, 상기 회복된 노드 간 가중치 커널에 대한 재훈련을 수행하는 회복 재훈련부를 더 포함하는 것인, 다중 프루닝 장치
|