1 |
1
프로세싱 소자들;상기 프로세싱 소자들에 커널 데이터 세트를 제공하는 커널 데이터 메모리;상기 프로세싱 소자들에 입력 데이터 세트를 제공하는 데이터 메모리; 그리고상기 프로세싱 소자들에 커맨드들을 제공하는 제어기를 포함하고,상기 프로세싱 소자들 중 제1 프로세싱 소자는 상기 제어기로부터 수신된 제1 커맨드 및 상기 데이터 메모리로부터 수신된 제1 입력 데이터를 지연 시간 동안 지연한 후에 제2 프로세싱 소자로 전달하고,상기 제어기는 상기 지연 시간을 조절하는 프로세서
|
2 |
2
제1항에 있어서,상기 제2 프로세싱 소자는 상기 제1 프로세싱 소자로부터 수신된 상기 제1 커맨드 및 상기 제1 입력 데이터를 상기 지연 시간 동안 지연한 후에 제3 프로세싱 소자로 전달하는 프로세서
|
3 |
3
제2항에 있어서,상기 프로세싱 소자들 중 제4 프로세싱 소자는 상기 제1 프로세싱 소자로부터 상기 제1 커맨드를 수신하고, 상기 데이터 버퍼로부터 제2 입력 데이터를 수신하고, 그리고 상기 제1 커맨드 및 상기 제2 입력 데이터를 지연하여 제5 프로세싱 소자로 전달하는 프로세서
|
4 |
4
제3항에 있어서,상기 제5 프로세싱 소자는 상기 제4 프로세싱 소자로부터 수신된 상기 제1 커맨드 및 상기 제2 입력 데이터를 상기 지연 시간 동안 지연한 후에 제6 프로세싱 소자로 전달하는 프로세서
|
5 |
5
제2항에 있어서,상기 커널 데이터 메모리는 상기 제1 프로세싱 소자에 제1 커널 데이터를 제공하고, 그리고 상기 지연 시간이 경과한 후에 상기 제2 프로세싱 소자에 제2 커널 데이터를 제공하는 프로세서
|
6 |
6
제1항에 있어서,상기 제1 커맨드 및 상기 제1 입력 데이터는 상기 제2 프로세싱 소자로부터 적어도 하나의 프로세싱 소자를 통해 제3 프로세싱 소자로 전달되고, 그리고상기 제3 프로세싱 소자는 상기 제1 커맨드 및 상기 제1 입력 데이터에 기반한 연산을 수행한 후에 상기 제1 커맨드 및 상기 제1 입력 데이터를 다른 프로세싱 소자로 전달하지 않는 프로세서
|
7 |
7
제1항에 있어서,상기 제1 프로세싱 소자는 상기 제어기로부터 수신된 제2 커맨드 및 상기 데이터 메모리로부터 수신된 제2 입력 데이터를 상기 지연 시간 동안 지연한 후에 상기 제2 프로세싱 소자로 전달하는 프로세서
|
8 |
8
제1항에 있어서,상기 제1 프로세싱 소자는 상기 커널 데이터 메모리로부터 수신된 제1 커널 데이터 및 상기 제1 입력 데이터에 대해 상기 제1 커맨드에 기반한 연산을 수행하여 제1 출력 데이터를 생성하고, 그리고 상기 제1 출력 데이터를 지연 없이 상기 데이터 메모리로 전달하는 프로세서
|
9 |
9
제8항에 있어서,상기 제2 프로세싱 소자는 상기 커널 데이터 메모리로부터 수신된 제2 커널 데이터 및 상기 제1 입력 데이터에 대해 상기 제1 커맨드에 기반한 연산을 수행하여 제2 출력 데이터를 생성하고, 그리고 상기 제1 출력 데이터를 지연 없이 상기 제1 프로세싱 소자로 전달하는 프로세서
|
10 |
10
행들 및 열들로 배열되는 복수의 프로세싱 소자들을 포함하는 프로세서의 동작 방법에 있어서:입력 데이터의 길이를 식별하는 단계;입력 데이터의 길이 및 상기 복수의 프로세싱 소자들의 전송 경로의 길이에 따라 지연 시간을 계산하는 단계; 그리고상기 복수의 프로세싱 소자들 중 적어도 일부의 프로세싱 소자들에서 상기 지연 시간만큼 상기 입력 데이터 및 커널 데이터를 지연시키며 연산을 수행하는 단계를 포함하는 동작 방법
|
11 |
11
제10항에 있어서,상기 입력 데이터의 길이를 식별하는 단계는:상기 입력 데이터 중 하나의 행의 프로세싱 소자들로 입력되는 데이터를 처리하기 위해 필요한 프로세싱 소자들의 수를 식별하는 단계를 포함하는 동작 방법
|
12 |
12
제11항에 있어서,상기 프로세싱 소자들의 전송 경로의 길이는, 상기 복수의 프로세싱 소자들 중 하나의 행에 배치된 프로세싱 소자들의 수인 동작 방법
|
13 |
13
제12항에 있어서,상기 데이터를 처리하기 위해 필요한 프로세싱 소자들의 수가 상기 하나의 행에 배치된 프로세싱 소자들의 수보다 클 때, 상기 지연 시간은 1 이상인 동작 방법
|
14 |
14
제12항에 있어서,상기 데이터를 처리하기 위해 필요한 프로세싱 소자들의 수가 상기 하나의 행에 배치된 프로세싱 소자들의 수와 같거나 그보다 작을 때, 상기 지연 시간은 0인 동작 방법
|
15 |
15
제10항에 있어서,상기 지연 시간은 상기 복수의 프로세싱 유닛들의 동작 사이클의 횟수로 카운트되는 동작 방법
|