1 |
1
초해상화를 수행하는 인공 신경망(Artificial Neural Network)의 가중치를 처리하는 방법에 있어서,상기 인공 신경망 내 레이어들 및 상기 레이어들 간의 연결 강도에 관한 가중치를 양자화하기 위한 보존 비율을 결정하는 단계;상기 보존 비율에 기초하여, 상기 인공 신경망 내 레이어들 내 일부 레이어들의 양자화 비트를 결정하는 단계;상기 결정된 양자화 비트에 기초하여 학습된 상기 인공 신경망의 정확도를 획득하는 단계; 및상기 정확도 및 기준 상태의 상기 인공 신경망의 정확도의 차이가 작아 지도록 상기 인공 신경망 내 일부 레이어들의 양자화 비트를 갱신하는 단계; 를 포함하는, 방법
|
2 |
2
제1항에 있어서, 상기 방법은상기 보존 비율에 기초하여, 상기 인공 신경망 내 레이어들 내 일부 레이어들을 프루닝(Pruning)함으로써, 상기 프루닝된 레이어들의 가중치를 0으로 결정하는 단계; 및상기 인공 신경망 내 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치를 포함하는 일부 레이어들을 포함하는 인공 신경망의 정확도가 상기 기준 상태의 인공 신경망의 정확도와 유사해지도록, 상기 프루닝된 일부 레이어들 및 상기 인공 신경망 내 일부 레이어들의 양자화 비트를 갱신하는 단계; 를 포함하는, 방법
|
3 |
3
제1항에 있어서, 상기 보존 비율을 결정하는 단계는상기 인공 신경망의 학습 주기 단위에 관한 에피소드가 진행됨에 따라 상기 보존 비율을 점차적으로 줄이는 단계; 를 포함하는, 방법
|
4 |
4
제2항에 있어서, 상기 방법은소정의 에피소드가 진행되는 동안 무작위로 상기 신경망 내 적어도 일부 레이어들의 양자화 비트를 결정하는 단계;상기 소정의 에피소드가 진행되는 동안 무작위로 상기 신경망 내 적어도 일부 레이어들을 프루닝하는 단계;상기 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치가 할당되는 일부 레이어들을 포함하는 인공 신경망의 정확도가 입력되면, 상기 인공 신경망 내 레이어들의 중요도를 출력하는 강화 학습 모델을 이용하여 상기 인공 신경망 내 레이어들의 중요도를 식별하는 단계; 및상기 식별된 중요도에 기초하여 상기 프루닝된 일부 레이어들 및 상기 일부 레이어들의 양자화 비트를 갱신하는 단계; 를 포함하는, 방법
|
5 |
5
제4항에 있어서, 상기 중요도를 식별하는 단계는상기 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치가 할당되는 일부 레이어들을 포함하는 인공 신경망의 정확도에 더하여, 상기 기준 상태의 인공 신경망의 정확도 및 상기 인공 신경망의 상태 정보를 상기 강화 학습 모델에 더 입력함으로써, 상기 인공 신경망 내 레이어들의 중요도를 식별하는 단계; 를 포함하는, 방법
|
6 |
6
제2항에 있어서, 상기 프루닝된 일부 레이어들 및 상기 양자화 비트가 결정된 상기 일부 레이어들은, 상기 인공 신경망 내 non-linear 매핑 동작을 수행하는 레이어들인 것을 특징으로 하는, 방법
|
7 |
7
제2항에 있어서, 상기 인공 신경망은초해상화(Super-resolution)를 수행하는 딥러닝 기반 모델이고, 이미지가 입력되면 상기 입력된 이미지의 해상도를 변환하는데 사용되는 것을 특징으로 하는, 방법
|
8 |
8
제2항에 있어서, 상기 방법은상기 인공 신경망의 정보들 중 일부의 정보만을 포함하는 프록시 신경망 모델을 생성하는 단계;상기 생성된 프록시 신경망 모델 내 일부 레이어들을 프루닝하고, 상기 프록시 신경망 모델 내 일부 레이어들에 대한 양자화 비트를 결정하며, 상기 프루닝된 일부 레이어들 및 상기 일부 레이어들에 대한 양자화 비트를 최적화 하는 단계; 및상기 최적화된 양자화 비트를 가지는 일부 레이어들 및 상기 최적화된 프루닝된 일부 레이어들을 포함하는 프록시 신경망 모델을 상기 인공 신경망에 대응되도록 선형 확장하는 단계; 를 포함하는, 방법
|
9 |
9
초해상화를 수행하는 인공 신경망의 가중치를 처리하는 전자 장치에 있어서,하나 이상의 인스트럭션을 저장하는 메모리; 및상기 하나 이상의 인스트럭션들을 실행하는 적어도 하나의 프로세서; 를 포함하고,상기 적어도 하나의 프로세서는 상기 하나 이상의 인스트럭션을 실행함으로써,상기 인공 신경망 내 레이어들 및 상기 레이어들 간의 연결 강도에 관한 가중치를 양자화하기 위한 보존 비율을 결정하고,상기 보존 비율에 기초하여, 상기 인공 신경망 내 레이어들 내 일부 레이어들의 양자화 비트를 결정하고,상기 결정된 양자화 비트에 기초하여 학습된 상기 인공 신경망의 정확도를 획득하고,상기 정확도 및 기준 상태의 상기 인공 신경망의 정확도의 차이가 작아 지도록 상기 인공 신경망 내 일부 레이어들의 양자화 비트를 갱신하는, 전자 장치
|
10 |
10
제9항에 있어서, 상기 적어도 하나의 프로세서는상기 보존 비율에 기초하여, 상기 인공 신경망 내 레이어들 내 일부 레이어들을 프루닝(Pruning)함으로써, 상기 프루닝된 레이어들의 가중치를 0으로 결정하고,상기 인공 신경망 내 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치를 포함하는 일부 레이어들을 포함하는 인공 신경망의 정확도가 상기 기준 상태의 인공 신경망의 정확도와 유사해지도록, 상기 프루닝된 일부 레이어들 및 상기 인공 신경망 내 일부 레이어들의 양자화 비트를 갱신하는, 전자 장치
|
11 |
11
제9항에 있어서, 상기 적어도 하나의 프로세서는상기 인공 신경망의 학습 주기 단위에 관한 에피소드가 진행됨에 따라 상기 보존 비율을 점차적으로 줄이는 것을 특징으로 하는, 전자 장치
|
12 |
12
제10항에 있어서, 상기 적어도 하나의 프로세서는소정의 에피소드가 진행되는 동안 무작위로 상기 신경망 내 적어도 일부 레이어들의 양자화 비트를 결정하고,상기 소정의 에피소드가 진행되는 동안 무작위로 상기 신경망 내 적어도 일부 레이어들을 프루닝하고,상기 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치가 할당되는 일부 레이어들을 포함하는 인공 신경망의 정확도가 입력되면, 상기 인공 신경망 내 레이어들의 중요도를 출력하는 강화 학습 모델을 이용하여 상기 인공 신경망 내 레이어들의 중요도를 식별하고,상기 식별된 중요도에 기초하여 상기 프루닝된 일부 레이어들 및 상기 일부 레이어들의 양자화 비트를 갱신하는, 전자 장치
|
13 |
13
제12항에 있어서, 상기 적어도 하나의 프로세서는상기 프루닝된 일부 레이어들 및 상기 양자화 비트에 따라 양자화되는 가중치가 할당되는 일부 레이어들을 포함하는 인공 신경망의 정확도에 더하여, 상기 기준 상태의 인공 신경망의 정확도 및 상기 인공 신경망의 상태 정보를 상기 강화 학습 모델에 더 입력함으로써, 상기 인공 신경망 내 레이어들의 중요도를 식별하는 단계; 를 포함하는, 전자 장치
|
14 |
14
제10항에 있어서, 상기 프루닝된 일부 레이어들 및 상기 양자화 비트가 결정된 상기 일부 레이어들은, 상기 인공 신경망 내 non-linear 매핑 동작을 수행하는 레이어들인 것을 특징으로 하는, 전자 장치
|
15 |
15
제10항에 있어서, 상기 인공 신경망은초해상화(Super-resolution)를 수행하는 딥러닝 기반 모델이고, 이미지가 입력되면 상기 입력된 이미지의 해상도를 변환하는데 사용되는 것을 특징으로 하는, 전자 장치
|
16 |
16
제10항에 있어서, 상기 적어도 하나의 프로세서는상기 인공 신경망의 정보들 중 일부의 정보만을 포함하는 프록시 신경망 모델을 생성하고,상기 생성된 프록시 신경망 모델 내 일부 레이어들을 프루닝하고, 상기 프록시 신경망 모델 내 일부 레이어들에 대한 양자화 비트를 결정하며, 상기 프루닝된 일부 레이어들 및 상기 일부 레이어들에 대한 양자화 비트를 최적화 하고,상기 최적화된 양자화 비트를 가지는 일부 레이어들 및 상기 최적화된 프루닝된 일부 레이어들을 포함하는 프록시 신경망 모델을 상기 인공 신경망 에 대응되도록 선형 확장하는, 전자 장치
|
17 |
17
초해상화를 수행하는 인공 신경망(Artificial Neural Network)의 가중치를 처리하는 방법에 있어서,상기 인공 신경망 내 레이어들 및 상기 레이어들 간의 연결 강도에 관한 가중치를 양자화하기 위한 보존 비율을 결정하는 단계;상기 보존 비율에 기초하여, 상기 인공 신경망 내 레이어들 내 일부 레이어들의 양자화 비트를 결정하는 단계;상기 결정된 양자화 비트에 기초하여 학습된 상기 인공 신경망의 정확도를 획득하는 단계; 및상기 정확도 및 기준 상태의 상기 인공 신경망의 정확도의 차이가 작아 지도록 상기 인공 신경망 내 일부 레이어들의 양자화 비트를 갱신하는 단계; 를 포함하는, 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체
|