1 |
1
훈련된 인공 신경망의 압축을 위한 장치로서, 파라미터 감소 모듈(parameter reduction module), 파라미터 근사화 모듈(parameter approximation module), 및 인코딩 모듈(encoding module)을 포함하고, 상기 파라미터 감소 모듈은, 상기 훈련된 인공 신경망을 표현하는 가중치를 포함하는 파라미터의 개수를 감소시키고,상기 파라미터 근사화 유닛은, 상기 훈련된 인공 신경망을 표현하는 가중치를 포함하는 파라미터 또는 상기 파라미터 감소 모듈에 의하여 감소된 파라미터를 근사화하며, 상기 인코딩 모듈은, 상기 파라미터 근사화 유닛에 의하여 근사화된 파라미터들을 인코딩하여 비트스트림을 생성하되, 양자화 파라미터 덴시티(quantization parameter density)와 양자화 파라미터로 표현되는 고정된 스텝 사이즈를 사용하는 균일 양자화(uniform quantizsation) 기법 또는 가중치 텐서가 코드북과 텐서 인덱스로 표현되는 코드북 기반 기법을 적용하는 것을 특징으로 하는 훈련된 인공 신경망의 압축 장치
|
2 |
2
제1항에 있어서, 상기 파라미터 감소 모듈은, 매트릭스 분해 기법을 이용하여 가중치 텐서(weight tensors)의 크기를 줄여서 상기 파라미터의 개수를 감소시키되, 상기 매트릭스 분해 기법에 사용되는 행렬 인자(factor)들, 랭크값(rank value, 정수 기반), 필터 재구성을 위한 리쉐이핑 모드(reshaping mode, 정수 기반) 및 최초 행렬과 재구성된 행렬의 차원(dimension)을 지시하는 정보 중에서 하나 이상을 생성하여 출력하는 것을 특징으로 하는 훈련된 인공 신경망의 압축 장치
|
3 |
3
제2항에 있어서, 상기 파라미터 감소 모듈이 상기 파라미터의 개수를 감소시키는 과정은 선택적인 과정으로서, 상기 비트스트림은 상기 파라미터의 개수를 감소시키는 과정이 수행되었는지 여부를 지시하는 정보를 포함하는 것을 특징으로 하는 훈련된 인공 신경망의 압축 장치
|
4 |
4
메모리 또는 스토리지에 저장되어 있는 프로그래밍 명령어를 가져와서 실행하는 프로세서를 포함하는 컴퓨터 시스템을 이용하여 훈련된 심층 인공 신경망을 압축하는 방법으로서, 훈련된 심층 신경망을 기술하는 가중치 매트릭스를 간략화하기 위한 파라미터 감소 단계;상기 파라미터 감소 단계에서 감소된 상기 가중치 매트릭스를 근사화하기 위한 파라미터 근사화 단계; 및상기 파라미터 근사화 단계에서 근사화된 가중치 매트릭스를 소정의 방향으로 스캔하고, 스캔된 가중치들을 순차적으로 엔트로피 코딩하여 비트스트림으로 출력하기 위한 인코딩 단계를 포함하고, 상기 인코딩 단계에서는, 상기 파라미터 근사화 유닛에 의하여 근사화된 파라미터들을 인코딩하여 비트스트림을 생성하되, 양자화 파라미터 덴시티(quantization parameter density)와 양자화 파라미터로 표현되는 고정된 스텝 사이즈를 사용하는 균일 양자화(uniform quantizsation) 기법 또는 가중치 텐서가 코드북과 텐서 인덱스로 표현되는 코드북 기반 기법을 적용하는 것을 특징으로 하는 훈련된 인공 신경망의 압축 방법
|