1 |
1
양자화 처리 시스템이, 양자화된 액티베이션(Activation) 및 가중치(Weight)를 기반으로 양자화된 네트워크의 컨벌루션(Convolution) 연산을 수행하는 단계; 및양자화 처리 시스템이, 다음 레이어의 입력 액티베이션을 생성하기 위해, 컨벌루션 연산 결과의 재-양자화를 수행하는 단계;를 포함하고, 컨벌루션 연산을 수행하는 단계는,기설정된 클리핑 범위(Clipping range) 밖의 데이터 중 필요 데이터를 기설정된 클리핑 범위 안으로 들어오도록 수정하고,재-양자화를 수행하는 단계는,수정된 데이터를 처리하여 원래 데이터를 획득하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
2 |
2
청구항 1에 있어서,컨벌루션 연산을 수행하는 단계는,양자화된 액티베이션 및 가중치를 읽어들여 곱셈 연산 및 덧셈 연산을 통한 최종 단일 결과를 생성하되, 곱셈 연산 후 기설정된 클리핑 범위 밖의 데이터 중 필요 데이터를 대상으로 필요 데이터가 기설정된 클리핑 범위 안으로 들어오도록 하는 연산을 수행하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
3 |
3
청구항 2에 있어서,컨벌루션 연산을 수행하는 단계는,기설정된 클리핑 범위 안으로 들어오도록 하는 연산을 수행하고자 하는 필요 데이터의 위치 정보를 필요 데이터와 분리하여 저장하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
4 |
4
청구항 3에 있어서,컨벌루션 연산을 수행하는 단계는,필요 데이터의 위치 정보를 저장하기 위해, 데이터 크기의 마스크(Mask) 또는 필요 데이터의 좌표값을 저장하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
5 |
5
청구항 3에 있어서,컨벌루션 연산을 수행하는 단계는,추가 하드웨어 연산 오버헤드를 최소화하기 위해, 필요 데이터가 기설정된 클리핑 범위 안으로 들어오도록 하는 경우, 시프트 연산만을 수행하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
6 |
6
청구항 5에 있어서,컨벌루션 연산을 수행하는 단계는,시프트 연산을 수행하여, 필요 데이터를 수정하는 경우, 수정된 데이터의 값 및 수행된 시프트 연산에 대한 정보를 포함하는 범위 외 데이터 처리 정보를 생성하고, 재-양자화를 수행하는 단계는,생성된 범위 외 데이터 처리 정보를 이용하여 수정된 데이터를 원래 데이터로 복원하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
7 |
7
청구항 6에 있어서,재-양자화를 수행하는 단계는,수정된 데이터의 위치 정보를 통해 현재 곱해지는 액티베이션 값이 재-양자화의 수행 전 수정된 값인 것으로 확인되는 경우, 수행된 시프트 연산의 반대 연산을 통하여 양자화 전 원래 데이터를 획득하는 것을 특징으로 하는 딥러닝 네트워크 양자화 처리 방법
|
8 |
8
양자화된 액티베이션(Activation) 및 가중치(Weight)를 기반으로 양자화된 네트워크의 컨벌루션(Convolution) 연산을 수행하되, 기설정된 클리핑 범위(Clipping range) 밖의 데이터 중 필요 데이터를 기설정된 클리핑 범위 안으로 들어오도록 수정하는 컨벌루션 연산 모듈; 및다음 레이어의 입력 액티베이션을 생성하기 위해, 컨벌루션 연산 결과의 재-양자화를 수행하되, 수정된 데이터가 확인되면, 수정된 데이터를 처리하여 원래 데이터를 획득하는 재-양자화 모듈;를 포함하는 딥러닝 네트워크 양자화 처리 시스템
|