1 |
1
복수의 레이어로 구성된 딥러닝 네트워크의 경량화 방법에 있어서:(a) 딥러닝 네트워크 레이어를 양자화 하는 단계;(b) 상기 양자화된 딥러닝 네트워크 레이어에 의한 추론 결과와 양자화 전 원본 딥러닝 네트워크 레이어에 의한 추론 결과의 차이에 의한 왜곡정도(Distortion)를 계산하는 단계;(c) 상기 딥러닝 네트워크의 최종 출력 활성화 데이터에 엔트로피 코딩을 적용하여 인코딩된 비트 크기를 구하는 단계;(d) 상기 왜곡정도와 상기 인코딩된 비트 크기를 고려한 비용함수를 계산하는 단계;(e) 상기 비용함수가 최소가 되는 양자화 비트 파라미터를 구하는 단계; 및(f) 상기 (a)단계 내지 (e) 단계를 상기 딥러닝 네트워크의 모든 레이어에 대해 반복하는 단계;를 포함하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
2 |
2
제1항에 있어서,상기 (f)단계는 상기 딥러닝 네트워크의 마지막 레이어에서 처음 레이어까지 역순으로 수행하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
3 |
3
제1항에 있어서,상기 (f)단계는 상기 딥러닝 네트워크의 처음 레이어에서 마지막 레이어까지 순서대로 수행하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
4 |
4
제1항에 있어서,상기 딥러닝 네트워크는 비지도 스테레오 학습을 위한 딥러닝 네트워크인 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
5 |
5
제1항에 있어서,상기 (d)단계에서 상기 비용함수는 상기 인코딩된 비트 크기에 가중치(λ)를 곱한 값과 상기 왜곡 정도를 더한 값으로 계산하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
6 |
6
제1항에 있어서,상기 (a) 내지 (e)단계를 마친 레이어에의 양자화 비트 파라미터와 네트워크 가중치는 고정하고 다음 레이어에 대해 상기 (a) 내지 (e)단계를 반복하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 방법
|
7 |
7
딥러닝 네트워크 레이어를 양자화하는 레이어 양자화부;딥러닝 네트워크의 출력인 활성화 데이터를 엔트로피 코딩하는 엔트로피 코딩부; 및상기 양자화된 딥러닝 네트워크 레이어에 의한 추론 결과와 양자화 전 원본 딥러닝 네트워크 레이어에 의한 추론 결과의 차이에 의한 왜곡정도와, 상기 엔트로피 코딩된 활성화 데이터의 비트 크기에 의해 비용함수를 계산하여 상기 비용함수가 최소가 되는 양자화 비트 파라미터를 구하는 제어부;를 포함하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|
8 |
8
제7항에 있어서,상기 제어부는 상기 딥러닝 네트워크의 모든 레이어에 대해 상기 양자화 비트 파라미터를 구하되, 상기 딥러닝 네트워크의 마지막 레이어에서 처음 레이어까지 역순으로 구하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|
9 |
9
제7항에 있어서,상기 제어부는 상기 딥러닝 네트워크의 모든 레이어에 대해 상기 양자화 비트 파라미터를 구하되, 상기 딥러닝 네트워크의 처음 레이어에서 마지막 레이어까지 순서대로 구하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|
10 |
10
제7항에 있어서,상기 딥러닝 네트워크는 비지도 스테레오 학습을 위한 딥러닝 네트워크인 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|
11 |
11
제7항에 있어서,상기 제어부는 상기 비용함수를 상기 인코딩된 비트 크기에 가중치(λ)를 곱한 값과 상기 왜곡 정도를 더한 값으로 계산하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|
12 |
12
제7항에 있어서,상기 제어부는 상기 양자화 비트 파라미터를 구한 레이어의 양자화 비트 파라미터와 네트워크 가중치를 고정하고 다음 레이어에 대해 양자화 비트 파라미터를 구하는 것을 특징으로 하는, 비지도 스테레오 학습을 위한 딥러닝 네트워크 경량화 장치
|