1 |
1
위노그라드(Winograd) 변환 컨볼루션을 위한 다차원 병렬 학습(Multi-dimensional Parallel Training) 방법에 있어서,복수의 클러스터와 복수의 그룹에 의해 2차원으로 배치된 복수의 작업자들에게 입력 데이터를 복수의 타일들로 분산 전달하되, 상기 복수의 타일들을 상기 복수의 클러스터별로 분산하여 전달하는 단계;상기 복수의 클러스터 각각의 작업자들을 통해, 상기 분산 전달된 입력 데이터에 대한 데이터 병렬 처리(data parallelism)를 수행하는 단계; 및상기 복수의 그룹 각각의 작업자들을 통해, 상기 분산 전달된 입력 데이터 중 상기 복수의 그룹 각각에 적용되는 상기 복수의 타일들의 요소 단위에 대한 인트라-타일 병렬 처리(intra-tile parallelism)를 수행하는 단계를 포함하는 다차원 병렬 학습 방법
|
2 |
2
제1항에 있어서,상기 인트라 타일 병렬 처리를 수행하는 단계는,위노그라드 도메인 내적에서 상기 복수의 타일들 내부의 각각의 동일한 위치에 배치된 요소 단위의 내적을 통해 상기 인트라-타일 병렬 처리를 수행하는 것을 특징으로 하는 다차원 병렬 학습 방법
|
3 |
3
제1항에 있어서,상기 복수의 그룹 각각에 포함된 작업자들은 가중치의 집단 연산을 지원하는 링 토폴로지를 통해 상호 연결되고,상기 복수의 클러스터 각각에 포함된 작업자들은 타일 수집/분산을 위해 올-투-올 트래픽(all-to-all traffic)을 지원하는 고연결성(high-connectivity)의 토폴로지를 통해 상호 연결되는 것을 특징으로 하는 다차원 병렬 학습 방법
|
4 |
4
제1항에 있어서,상기 입력 데이터가 포함하는 입력 특성 맵의 크기 및 가중치 크기 중 적어도 하나에 따라 상기 복수의 그룹들을 서로 연결하는 호스트를 통해 상기 복수의 클러스터의 수와 상기 복수의 그룹의 수를 동적으로 변경하는 단계를 더 포함하는 다차원 병렬 학습 방법
|
5 |
5
제1항에 있어서,상기 복수의 작업자들 중 원본 작업자가 대상 작업자에게 실제 값을 전송하기 전에 예측을 위한 타일 요소의 양자화된 값을 전송하고, 상기 대상 작업자가 상기 양자화된 값으로부터 공간 도메인 뉴런의 활성화를 예측하여 불필요한 타일 수집을 스킵하는 것을 특징으로 하는 다차원 병렬 학습 방법
|
6 |
6
제1항에 있어서,상기 복수의 작업자 각각은 제어부, 연산부 및 통신부를 포함하는 확장 가능한 NDP(Near-Data Processing) 아키텍처로 구현되는 것을 특징으로 하는 다차원 병렬 학습 방법
|
7 |
7
컴퓨터 장치와 결합되어 제1항 내지 제6항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
|
8 |
8
제1항 내지 제6항 중 어느 한 항의 방법을 컴퓨터 장치에 실행시키기 위한 컴퓨터 프로그램이 기록되어 있는 컴퓨터 판독 가능한 기록매체
|
9 |
9
위노그라드(Winograd) 변환 컨볼루션을 위한 다차원 병렬 학습(Multi-dimensional Parallel Training) 방법을 수행하는 컴퓨터 장치에 있어서,상기 컴퓨터 장치에서 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서를 포함하고,상기 적어도 하나의 프로세서에 의해,복수의 클러스터와 복수의 그룹에 의해 2차원으로 배치된 복수의 작업자들에게 입력 데이터를 복수의 타일들로 분산 전달하되, 상기 복수의 타일들을 상기 복수의 클러스터별로 분산하여 전달하고,상기 복수의 클러스터 각각의 작업자들을 통해, 상기 분산 전달된 입력 데이터에 대한 데이터 병렬 처리(data parallelism)를 수행하고,상기 복수의 그룹 각각의 작업자들을 통해, 상기 분산 전달된 입력 데이터 중 상기 복수의 그룹 각각에 적용되는 상기 복수의 타일들의 요소 단위에 대한 인트라-타일 병렬 처리(intra-tile parallelism)를 수행하는것을 특징으로 하는 컴퓨터 장치
|
10 |
10
제9항에 있어서,상기 복수의 작업자 각각은,호스트에서 작성되는 태스크 그래프를 저장하고, 상기 태스크 그래프에 기초하여 미리 정의된 순서로 작업을 로드하며, 종속성 검사에 기반한 업데이트 카운터를 제어하는 제어부;행렬 곱셈을 위한 연산 어레이(Systolic Array) 및 상기 행렬 곱셈의 사전 및 사후 처리를 위해 프로그래밍 기능을 추가하기 위한 벡터 프로세서를 포함하는 연산부; 및유니캐스트 통신 로직 및 링-기반 집단 통신 로직을 포함하는 통신부를 포함하는 것을 특징으로 하는 컴퓨터 장치
|