1 |
1
범용 계산 그래픽 처리 장치(GPGPU:General-Purpose computing on Graphics Processing Units)에서 스트리밍 멀티프로세서(SM:Streaming Multiprocessor)로서,상기 스트리밍 멀티프로세서는 내부의 L1 데이터 캐쉬에 저장된 데이터를 코어로 인출하거나, 상기 L1 데이터 캐쉬에 원하는 데이터가 존재하지 않을 경우, 하위 레벨 메모리로 접근하여 원하는 데이터를 인출하고, 상기 L1 데이터 캐쉬에 데이터를 저장하며,상기 L1 데이터 캐쉬에서의 미스 발생 여부, 미스 상태 홀딩 레지스터(MSHRs,Miss-Status Holding Registers)의 데이터량 및 미스큐(Miss Queues)의 데이터량을 모니터링하는 모니터링 유닛; 및주소 생성기에서 생성된 주소를 입력받고, 상기 L1 데이터 캐쉬로 접근하여 해당 주소의 데이터를 인출하거나 상기 하위 레벨 메모리로 우회 접근하여 데이터가 인출되게 하는 캐쉬 우회 유닛;을 포함하고,상기 캐쉬 우회 유닛은 미리 정해진 리프레시 기간(Refreshing Phase) 동안에는 상기 하위 레벨 메모리로 접근하지 않고 상기 L1 데이터 캐쉬로 접근하여 데이터를 인출하는 한편, 상기 모니터링 유닛에서 획득한 정보로부터 상기 L1 데이터 캐쉬의 미스 발생률을 계산하여 상기 미스 발생률에 따라 증감하는 바이패스 기간(Bypassing Phase)을 계산하며, 상기 리프레시 기간의 종료 후, 상기 바이패스 기간 동안에는 상기 L1 데이터 캐쉬로 접근하지 않고 상기 하위 레벨 메모리로 접근하여 데이터가 인출되게 하는 것을 특징으로 하는 스트리밍 멀티프로세서
|
2 |
2
제 1 항에 있어서,상기 리프레시 기간과 상기 바이패스 기간은 서로 번갈아 진행되며, 각 리프레시 기간은 미리 정해진 일정한 시간동안 진행되고, 각 바이패스 기간은 이전 리프레시 기간에서 계산된 미스 발생률에 따라 가변하는 것을 특징으로 하는 스트리밍 멀티프로세서
|
3 |
3
제 1 항 또는 제 2 항의 스트리밍 멀티프로세서들을 포함하는 범용 계산 그래픽 처리 장치
|
4 |
4
제 3 항의 범용 계산 그래픽 처리 장치가 임베디드된 임베디드 시스템
|
5 |
5
제 2 항의 스트리밍 멀티프로세서를 이용하여 상기 L1 데이터 캐쉬에서 데이터를 인출하거나 또는 상기 L1 데이터 캐쉬를 우회하여 상기 하위 레벨 메모리에서 데이터를 인출하는 캐쉬 우회 기법으로서,상기 주소 생성기에서 주소가 생성되는 단계;상기 주소 생성기에서 생성된 주소를 로드 스토어 큐에 적재하는 단계; 및상기 캐쉬 우회 유닛이 상기 로드 스토어 큐의 주소를 입력받아 상기 L1 데이터 캐쉬로 접근하여 해당 주소의 데이터를 인출하거나 상기 하위 레벨 메모리로 우회 접근하여 데이터가 인출되게 하는 단계;를 포함하고,상기 캐쉬 우회 유닛은 미리 정해진 리프레시 기간(Refreshing Phase) 동안에는 상기 하위 레벨 메모리로 접근하지 않고 상기 L1 데이터 캐쉬로 접근하여 데이터를 인출하는 한편, 상기 모니터링 유닛에서 획득한 정보로부터 상기 L1 데이터 캐쉬의 미스 발생률을 계산하여 상기 미스 발생률에 따라 증감하는 바이패스 기간(Bypassing Phase)을 계산하며, 상기 리프레시 기간의 종료 후, 상기 바이패스 기간 동안에는 상기 L1 데이터 캐쉬로 접근하지 않고 상기 하위 레벨 메모리로 접근하여 데이터가 인출되게 하는 것을 특징으로 하는 캐쉬 우회 기법
|