1 |
1
가속기의 동작 방법에 있어서,상기 가속기에 포함된 하나 이상의 프로세싱 엘리먼트들을 이용하여 제1 태스크를 실행하는 중 선점 요청을 수신하는 단계;상기 선점 요청에 응답하여 상기 가속기의 내부 메모리에 저장된 상기 제1 태스크의 컨텍스트 정보를 상기 가속기의 외부 메모리로 이동시키는 단계; 및상기 하나 이상의 프로세싱 엘리먼트들을 이용하여 상기 선점 요청에 따른 제2 태스크를 실행하는 단계를 포함하는가속기의 동작 방법
|
2 |
2
제1항에 있어서,상기 제1 태스크의 컨텍스트 정보는상기 제1 태스크에 따라 상기 하나 이상의 프로세싱 엘리먼트들에서 수행된 연산 결과를 포함하는,가속기의 동작 방법
|
3 |
3
제1항에 있어서,상기 제1 태스크의 컨텍스트 정보를 이동시키는 단계는상기 선점 요청이 수신되기 전까지 상기 하나 이상의 프로세싱 엘리먼트들에서 상기 제1 태스크에 따른 일련의 연산들이 수행되어 상기 가속기의 온-칩 메모리에 저장된 연산 결과와 상기 일련의 연산들 중 일부가 수행되어 상기 가속기의 중간 버퍼에 저장된 중간 연산 결과를 상기 외부 메모리로 이동시키는,가속기의 동작 방법
|
4 |
4
제1항에 있어서,상기 제1 태스크의 컨텍스트 정보를 이동시키는 단계는상기 선점 요청이 수신될 때 상기 가속기의 중간 버퍼에 저장된 중간 연산 결과에 대해 남은 연산이 수행된 후 상기 가속기의 온-칩 메모리에 저장된 연산 결과를 상기 외부 메모리로 이동시키는,가속기의 동작 방법
|
5 |
5
제1항에 있어서,상기 제1 태스크의 컨텍스트 정보에 대한 이동 시간 및 상기 선점 요청에 의해 중단된 상기 제1 태스크의 대상 명령어에 대한 예상 실행 시간에 기초하여, 상기 컨텍스트 정보를 상기 외부 메모리로 이동시키는 동안 상기 대상 명령어를 실행할지 여부를 결정하는 단계를 더 포함하는가속기의 동작 방법
|
6 |
6
제5항에 있어서,상기 이동 시간은상기 컨텍스트 정보의 크기 및 상기 내부 메모리와 상기 외부 메모리 사이의 대역폭에 기초하여 결정되는,가속기의 동작 방법
|
7 |
7
제5항에 있어서,상기 예상 실행 시간은상기 제1 태스크의 대상 명령어 및 상기 대상 명령어의 피연산자 크기에 기초하여 결정되는,가속기의 동작 방법
|
8 |
8
제5항에 있어서,상기 결정하는 단계는상기 제1 태스크에서 상기 대상 명령어가 후속 명령어를 위한 것이라면, 상기 후속 명령어의 예상 실행 시간을 더 고려하여, 상기 대상 명령어 및 상기 후속 명령어를 실행할지 여부를 결정하는,가속기의 동작 방법
|
9 |
9
제5항에 있어서,인-플레이스 연산에 해당하는 상기 대상 명령어의 실행이 결정된 경우, 상기 인-플레이스 연산의 피연산자가 저장된 상기 외부 메모리의 주소에 상기 인-플레이스 연산의 결과를 저장하는 단계를 더 포함하는,가속기의 동작 방법
|
10 |
10
제1항에 있어서,상기 제2 태스크를 실행하는 단계는상기 선점 요청에 따라 상기 제1 태스크의 실행이 완전히 종료되기 전에 리소스 충돌이 발생하지 않는 범위 내에서 상기 제2 태스크의 실행을 시작하는,가속기의 동작 방법
|
11 |
11
제10항에 있어서,상기 제2 태스크의 실행 시작 시점은상기 제1 태스크에서 실행 중인 명령어의 시작 시점과 상기 명령어가 사용할 것으로 예상되는 리소스에 기초하여 결정되거나, 또는상기 제1 태스크에서 실행 중인 명령어가 사용하는 리소스 사용 정보에 기초하여 결정되는,가속기의 동작 방법
|
12 |
12
제1항에 있어서,상기 선점 요청은 실행이 요구되는 복수의 태스크들의 우선순위 및/또는 실행시간에 기초하여 결정되는,가속기의 동작 방법
|
13 |
13
제1항에 있어서,상기 제2 태스크의 실행이 완료되면, 상기 외부 메모리에 저장된 상기 제1 태스크의 컨텍스트 정보를 상기 내부 메모리로 이동시켜 상기 제1 태스크를 다시 실행하는 단계를 더 포함하는,가속기의 동작 방법
|
14 |
14
제1항에 있어서,상기 제1 태스크는 딥 뉴럴 네트워크의 추론 및/또는 학습을 포함하는,가속기의 동작 방법
|
15 |
15
제1항에 있어서,상기 제1 태스크가 딥 뉴럴 네트워크의 학습인 경우, 상기 이동시키는 단계는상기 제1 태스크에 따라 상기 하나 이상의 프로세싱 엘리먼트들에서 수행된 연산 결과 및 상기 딥 뉴럴 네트워크의 파라미터를 상기 외부 메모리로 이동시키는,가속기의 동작 방법
|
16 |
16
제1항에 있어서,상기 선점 요청에 따라 선점된 상기 제1 태스크의 상태 정보를 기록하는 단계를 더 포함하는,가속기의 동작 방법
|
17 |
17
제1항 내지 제16항 중에서 어느 하나의 항의 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 저장 매체
|
18 |
18
가속기에 있어서,할당된 태스크를 실행하는 하나 이상의 프로세싱 엘리먼트들;상기 할당된 태스크의 컨텍스트 정보를 저장하는 내부 메모리; 및상기 하나 이상의 프로세싱 엘리먼트들에서 제1 태스크가 수행되는 중 수신된 선점 요청에 응답하여, 상기 내부 메모리에 저장된 상기 제1 태스크의 컨텍스트 정보를 상기 가속기의 외부 메모리로 이동시키고, 상기 하나 이상의 프로세싱 엘리먼트들에서 상기 선점 요청에 따른 제2 태스크를 실행시키는 선점 모듈을 포함하는가속기
|
19 |
19
하나 이상의 프로세싱 엘리먼트들을 이용하여 제1 태스크를 실행하는 중 수신된 선점 요청에 응답하여 내부 메모리에 저장된 상기 제1 태스크의 컨텍스트 정보를 외부 메모리로 이동시키고, 상기 하나 이상의 프로세싱 엘리먼트들을 이용하여 상기 선점 요청에 따른 제2 태스크를 실행하는 가속기; 및 상기 가속기로부터 전송된 상기 제1 태스크의 컨텍스트 정보를 저장하는 외부 메모리를 포함하는전자 장치
|