1 |
1
개별 워프의 L1 캐시 이용률을 추적하고, 상기 개별 워프의 유형을 분류하며, 분류된 워프 유형에 따라 상기 개별 워프의 바이패스의 임계값을 결정하는 유형 분류 구조; 상기 개별 워프의 바이패스 이력을 기록하는 포화 카운터(Saturating Counter, SC) 및 상기 상기 개별 워프의 바이패스의 임계값을 비교하여 상기 개별 워프의 메모리 요청에 대한 바이패스를 적응적으로 결정하는 요청 바이패스 구조 및 상기 요청 바이패스 구조에 의해 바이패스되는 메모리 요청이 입력되는 모놀리식 3D 기반 NoC(Network on Chip)를 포함하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
2 |
2
제1항에 있어서, 상기 유형 분류 구조는, 상기 개별 워프의 L1 캐시 이용률을 추적하는 추적부; 상기 개별 워프의 L1 캐시 이용률에 따라 적어도 3개의 유형을 결정하는 워드 유형 결정부; 및상기 결정된 유형에 따라 상기 개별 워프의 바이패스 임계값을 할당하는 바이패스 임계값 할당부를 포함하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
3 |
3
제2항에 있어서, 상기 L1 캐시 이용률은 상기 개별 워프의 캐시 액세스 수(a), 캐시 미스 수(m) 및 예약 실패 수(r)이며, 상기 유형 결정부는, 모든 워프의 m/a 및 r/a의 평균과 상기 개별 워프의 m/a 및 r/a를 비교하여 상기 개별 워프의 유형을 결정하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
4 |
4
제3항에 있어서, 상기 유형 결정부는, m/a 및 r/a가 모든 워프의 평균보다 크거나 같은 워프를 T1 워프, 모든 워프의 평균보다 m/a 또는 r/a 중 하나가 더 큰 워프를 T2 워프, m/a 및 r/a가 모든 워프의 평균보다 작은 워프를 T3 워프로 결정하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
5 |
5
제4항에 있어서, 상기 바이패스 임계값 할당부는 상기 T1, T2 및 T3 워프에 대해 서로 다른 바이패스 임계값을 할당하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
6 |
6
제1항에 있어서, 상기 메모리 요청의 프로브 결과 태그 미스인 경우 상기 포화 카운터의 값이 증가하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
7 |
7
제6항에 있어서, 상기 포화 카운터는 상기 개별 워프의 아이디 별로 인덱싱되고, 상기 요청 바이패스 구조는 상기 포화 카운터의 값이 해당 워프의 바이패스 임계값 이상인 경우에만 L1 캐시를 바이패스하는 것으로 결정하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
8 |
8
제1항에 있어서, 상기 모놀리식 3D 비아 기반 NoC는 그리드 형 메쉬 구조를 갖는 복수의 라우터를 포함하고, 각 라우터는 네트워크에서의 위치 정의를 위한 고유한 주소를 가지며, 4개의 기본 방향(North, East, South 및 West)과 업/다운 방향의 6개의 물리적 포트를 포함하는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 장치
|
9 |
9
유형 분류 구조에서, 개별 워프의 L1 캐시 이용률을 추적하고, 상기 개별 워프의 유형을 분류하며, 분류된 워프 유형에 따라 상기 개별 워프의 바이패스의 임계값을 결정하는 단계; 및요청 바이패스 구조에서, 상기 개별 워프의 바이패스 이력을 기록하는 포화 카운터(Saturating Counter, SC) 및 상기 상기 개별 워프의 바이패스의 임계값을 비교하여 상기 개별 워프의 메모리 요청에 대한 바이패스를 적응적으로 결정하는 단계를 포함하되, 상기 요청 바이패스 구조에 의해 바이패스되는 메모리 요청은 모놀리식 3D 기반 NoC(Network on Chip)로 입력되는 모놀리식 3D 집적 기술 기반 NoC 구조를 활용한 GPU 캐시 바이패스 방법
|