5 |
5
범용 계산 그래픽 처리 장치(GPGPU:General-Purpose computing on Graphics Processing Units)의 스트리밍 멀티프로세서(SM:streaming multiprocessor)의 캐쉬 우회 기법으로서,상기 스트리밍 멀티프로세서는 내부의 L1 데이터 캐쉬에 저장된 데이터를 코어로 인출하거나, 상기 L1 데이터 캐쉬에 원하는 데이터가 존재하지 않을 경우, 하위 레벨 메모리로 접근하여 원하는 데이터를 인출하고, 상기 L1 데이터 캐쉬에 데이터를 저장하고,원하는 데이터가 저장된 주소를 생성하는 주소 생성기(address generator); 상기 주소 생성기의 주소를 입력받아 임시저장하며 아래의 우회 결정 모듈로 순차 출력하는 로드 스토어 큐(Load/Store Queue);상기 L1 데이터 캐쉬의 태그 정보와 블록 상태 정보(Hit 또는 Miss)를 갖는 엑스트라 태그 모듈(Extra Tags); 및 상기 로드 스토어 큐에 임시 저장된 주소와 상기 주소에 대응하는 상기 엑스트라 태그 모듈의 블록 상태 정보를 입력받고, 상기 블록 상태 정보가 히트(Hit)일 경우, 상기 L1 데이터 캐쉬에 접근하여 데이터를 인출하고, 상기 블록 상태 정보가 미스(Miss)일 경우, 상기 L1 데이터 캐쉬에 접근하지 않고, 상기 하위 레벨 메모리로 우회 접근하여 데이터가 인출되게 하는 우회 결정 모듈(Bypass decision);을 포함하며,상기 캐쉬 우회 기법:은,상기 주소 생성기에서 주소가 생성되는 단계;상기 주소 생성기에서 생성된 주소를 상기 로드 스토어 큐에 적재되는 동시에 상기 엑스트라 태그 모듈에서 상기 주소에 대응하는 태그의 블록 상태 정보를 확인하는 단계;상기 로드 스토어 큐에서 상기 우회 결정 모듈로 주소가 출력되고, 동시에 출력되는 주소에 대응하는 태그의 블록 상태 정보가 상기 엑스트라 태그 모듈에서 상기 우회 결정 모듈로 출력되는 단계;상기 우회 결정 모듈이 상기 블록 상태 정보가 히트(Hit)일 경우, 상기 L1 데이터 캐쉬에서 데이터가 인출되게 하고, 상기 블록 상태 정보가 미스(Miss)일 경우, 상기 L1 데이터 캐쉬에 접근하지 않고, 상기 하위 레벨 메모리로 우회 접근하여 데이터가 인출되게 하는 단계; 및상기 L1 데이터 캐쉬의 태그 정보와 갱신된 블록 상태 정보를 상기 엑스트라 태그 모듈에 저장하는 단계;를 포함하는 것을 특징으로 하는 캐쉬 우회 기법
|