1 |
1
미리 정해진 데이터 형태를 갖는 샘플 입력 데이터로 딥러닝 모델을 예비 수행(pre-run)하는 단계; 및상기 예비 수행을 통해, 스케줄링 결과를 생성하는 단계를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
2 |
2
제1항에 있어서,입력 데이터를 수신하는 단계; 및상기 입력 데이터에 대한 별도의 스케줄링 없이, 상기 스케줄링 결과에 기초하여 상기 입력 데이터에 대한 딥러닝 연산을 수행하는 단계를 더 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
3 |
3
제1항에 있어서,상기 예비 수행하는 단계는상기 예비 수행 도중에 발생한 가속기 연산 수행 요청을 기록하는 단계; 및상기 예비 수행 도중에 발생한 가속기 메모리 할당 또는 해제 요청을 기록하는 단계를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
4 |
4
제3항에 있어서,상기 스케줄링 결과를 생성하는 단계는상기 기록된 가속기 연산 수행 요청에 기초하여, 가속기 연산 수행 요청 기록을 생성하는 단계; 및상기 가속기 메모리 할당 또는 해체 요청에 기초하여, 상기 가속기에 메모리를 할당하는 단계를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
5 |
5
제1항에 있어서,상기 딥러닝 모델은상기 딥러닝 모델의 연산자(operator)를 의미하는 노드와 상기 연산자 사이의 관계를 의미하는 엣지로 구성된 그래프로 표현될 수 있는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
6 |
6
제1항에 있어서,연산-스트림 할당 알고리즘(operator-to-stream mapping algorithm)에 기초하여, 딥러닝 모델을 변환하는 단계를 더 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
7 |
7
제6항에 있어서,상기 딥러닝 모델을 변환하는 단계는상기 딥러닝 모델을 최소 등가 그래프(minimum equivalent graph)로 변환하는 단계;상기 최소 등가 그래프에 대한 이분법 그래프(bipartite graph)를 생성하는 단계;상기 이분법 그래프의 최대 매칭(mximum matching)을 결정하는 단계; 및상기 최대 매칭에 기초하여, 상기 노드를 상기 가속기의 스트림에 할당하는 단계를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
8 |
8
제1항에 있어서,상기 딥러닝 모델은정적 뉴럴 네트워크(static neural network)를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 방법
|
9 |
9
하드웨어와 결합되어 제1항 내지 제8항 중 어느 하나의 항의 방법을 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램
|
10 |
10
미리 정해진 데이터 형태를 갖는 샘플 입력 데이터로 딥러닝 모델을 예비 수행(pre-run)하고, 상기 예비 수행을 통해, 스케줄링 결과를 생성하는 프로세서를 포함하는 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
11 |
11
제10항에 있어서,상기 프로세서는상기 예비 수행 도중에 발생한 가속기 연산 수행 요청을 기록하고, 상기 예비 수행 도중에 발생한 가속기 메모리 할당 또는 해제 요청을 기록하는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
12 |
12
제11항에 있어서,상기 프로세서는상기 기록된 가속기 연산 수행 요청에 기초하여, 가속기 연산 수행 요청 기록을 생성하고, 상기 가속기 메모리 할당 또는 해체 요청에 기초하여, 상기 가속기에 메모리를 할당하는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
13 |
13
제10항에 있어서,상기 딥러닝 모델은상기 딥러닝 모델의 연산자(operator)를 의미하는 노드와 상기 연산자 사이의 관계를 의미하는 엣지로 구성된 그래프로 표현될 수 있는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
14 |
14
제10항에 있어서,상기 프로세서는연산-스트림 할당 알고리즘(operator-to-stream mapping algorithm)에 기초하여, 딥러닝 모델을 변환하는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
15 |
15
제14항에 있어서,상기 프로세서는상기 딥러닝 모델을 최소 등가 그래프(minimum equivalent graph)로 변환하고, 상기 최소 등가 그래프에 대한 이분법 그래프(bipartite graph)를 생성하고, 상기 이분법 그래프의 최대 매칭(mximum matching)을 결정하고, 상기 최대 매칭에 기초하여, 상기 노드를 상기 가속기의 스트림에 할당하는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
16 |
16
제10항에 있어서,상기 딥러닝 모델은정적 뉴럴 네트워크(static neural network)를 포함하는, 가속기 연산 스케줄링의 경량화 및 병렬화 장치
|
17 |
17
미리 정해진 데이터 형태를 갖는 샘플 입력 데이터로 딥러닝 모델을 예비 수행(pre-run)하고, 상기 예비 수행을 통해, 스케줄링 결과를 생성하는 호스트 프로세서; 및상기 호스트 프로세서에서 결정된 스케줄에 따라 상기 딥러닝 모델을 실행하는 가속기를 포함하는 전자 장치
|
18 |
18
제17항에 있어서,상기 호스트 프로세서입력 데이터를 수신하고,상기 가속기는상기 입력 데이터에 대한 별도의 스케줄링 없이, 상기 스케줄링 결과에 기초하여 상기 입력 데이터에 대한 딥러닝 연산을 수행하는, 전자 장치
|