1 |
1
그래픽 처리 장치에서의 범용 연산처리(General Purpose computing on Graphic Processing Unit, GPGPU)의 스크래치패드 메모리 할당 정보를 포함하는 디바이스 코드에 대해 시뮬레이션을 수행하고, 상기 스크래치패드 메모리 할당에 대한 실행 결과 정보를 추출하는 단계;상기 실행 결과 정보에 기초하여 상기 디바이스 코드에 포함되는 변수들의 메모리 사용 패턴을 분석하는 단계;상기 메모리 사용 패턴에 기초하여 상기 스크래치패드 메모리의 사용 우선순위 테이블을 구성하는 단계; 및상기 스크래치패드 메모리의 사용 우선순위 테이블에 기초하여, 메모리 접근 속도 지연의 원인이 되는 적어도 하나의 변수를 상기 스크래치패드 메모리에 할당하도록 상기 디바이스 코드를 재구성하는 단계를 포함하는스크래치패드 메모리 최적 컴파일 방법
|
2 |
2
제1항에 있어서, 상기 스크래치패드 메모리의 사용 우선순위 테이블은 상기 변수들 각각의 메모리 지연 시간 정보 및 상기 변수들 각각의 저장 공간 정보를 포함하는스크래치패드 메모리 최적 컴파일 방법
|
3 |
3
제2항에 있어서, 상기 디바이스 코드를 재구성하는 단계는,상기 스크래치패드 메모리의 여유 공간을 확인하는 단계; 상기 여유 공간 내에서 상기 메모리 지연 시간이 가장 큰 변수 조합을 확인하는 단계; 및상기 메모리 지연 시간이 가장 큰 변수 조합에 포함되는 적어도 하나 이상의 변수를 상기 스크래치패드 메모리에 할당하도록 상기 디바이스 코드를 재구성하는 단계를 포함하는스크래치패드 메모리 최적 컴파일 방법
|
4 |
4
제1항에 있어서, 이전 디바이스 코드의 스크래치패드 메모리 할당 정보와 상기 재구성된 디바이스 코드의 스크래치패드 메모리 할당 정보를 비교하는 단계;상기 스크래치패드 메모리 할당 정보의 변경이 있는 경우 상기 재구성된 디바이스 코드에 대해 상기 시뮬레이션을 수행하는 단계; 및상기 스크래치패드 메모리 할당 정보의 변경이 없는 경우 상기 재구성된 디바이스 코드를 GPU로 전달하고, 최적화 과정을 종료하는 단계를 더 포함하는스크래치패드 메모리 최적 컴파일 방법
|
5 |
5
제1항에 있어서, 상기 디바이스 코드는 PTX(Parallel Thread Execution) 코드인스크래치패드 메모리 최적 컴파일 방법
|
6 |
6
그래픽 처리 장치의 범용 연산처리(General Purpose computing on Graphic Processing Unit, GPGPU)의 스크래치패드 메모리 할당 정보를 포함하는 디바이스 코드에 대해 시뮬레이션을 수행하고, 상기 스크래치패드 메모리 할당에 대한 실행 결과 정보를 추출하는 시뮬레이션부;상기 실행 결과 정보에 기초하여 상기 디바이스 코드에 포함되는 변수들의 메모리 사용 패턴을 분석하는 메모리 사용 패턴 분석부;상기 메모리 사용 패턴에 기초하여 상기 스크래치패드 메모리의 사용 우선순위 테이블을 구성하는 테이블 구성부; 및상기 스크래치패드 메모리의 사용 우선순위 테이블에 기초하여, 메모리 접근 속도 지연의 원인이 되는 적어도 하나의 변수를 상기 스크래치패드 메모리에 할당하도록 상기 디바이스 코드를 재구성하는 코드 재구성부를 포함하는스크래치패드 메모리 최적 컴파일 장치
|
7 |
7
제6항에 있어서, 상기 스크래치패드 메모리의 사용 우선순위 테이블은 상기 변수들 각각의 메모리 지연 시간 정보 및 상기 변수들 각각의 저장 공간 정보를 포함하는스크래치패드 메모리 최적 컴파일 장치
|
8 |
8
제7항에 있어서, 상기 코드 재구성부는, 상기 스크래치패드 메모리의 여유 공간을 확인하고, 상기 여유 공간 내에서 상기 메모리 지연 시간이 가장 큰 변수 조합을 확인하고, 상기 메모리 지연 시간이 가장 큰 변수 조합에 포함되는 적어도 하나 이상의 변수를 상기 스크래치패드 메모리에 할당하도록 상기 디바이스 코드를 재구성하는스크래치패드 메모리 최적 컴파일 장치
|
9 |
9
제6항에 있어서, 상기 코드 재구성부는,이전 디바이스 코드의 스크래치패드 메모리 할당 정보와 상기 재구성된 디바이스 코드의 스크래치패드 메모리 할당 정보를 비교하고, 상기 스크래치패드 메모리 할당 정보의 변경이 있는 경우 상기 재구성된 디바이스 코드에 대해 상기 시뮬레이션을 수행하고, 상기 스크래치패드 메모리 할당 정보의 변경이 없는 경우 상기 재구성된 디바이스 코드를 GPU로 전달하고, 최적화 과정을 종료하는스크래치패드 메모리 최적 컴파일 장치
|
10 |
10
제6항에 있어서, 상기 디바이스 코드는 PTX(Parallel Thread Execution) 코드이고, 입력되는 프로그래밍 코드를 상기 PTX 코드로 변환하는 전처리부를 더 포함하는스크래치패드 메모리 최적 컴파일 장치
|
11 |
11
제1항 내지 제5항 중 어느 한 항의 방법을 수행하기 위한 프로그램을 기록한 컴퓨터로 판독 가능한 기록 매체
|