1 |
1
기계학습 데이터 특징 정보 및 OpenCL 장치 정보를 이용하여, 최적 OpenCL 파라미터를 설정하고, 커널 소스코드를 컴파일하여 바이너리 형태의 커널을 생성하는 BLAS 연산 가속화부, OpenCL 실행 환경 정보 및 상기 최적 OpenCL 파라미터를 이용하여 BLAS 연산을 위한 OpenCL 버퍼를 생성하고, 생성된 상기 OpenCL 버퍼에 접근 가능한 GPU가 커널을 통해 상기 BLAS 연산을 수행하여 임베디드 시스템에서의 기계학습을 가속화하는 OpenCL 실행부, 그리고 상기 BLAS 연산의 수행 결과를 기계학습 알고리즘에 반환하는 가속 장치 응용부를 포함하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
2 |
2
제1항에 있어서, 초기 분석 과정 수행 시 상기 OpenCL 장치 정보를 생성하는 가속 장치 분석부를 더 포함하고, 상기 OpenCL 장치 정보는, 상기 임베디드 시스템의 로컬 파일 시스템에 저장되고, 상기 임베디드 시스템에서 상기 기계학습을 수행할 때마다 상기 OpenCL 파라미터의 설정에 활용되는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
3 |
3
제1항에 있어서, 상기 가속 장치 응용부는, 입력된 행렬 크기 값 및 데이터 유형을 기반으로, 상기 기계학습 데이터 특징 정보가 실제 데이터의 크기와 일치하는지 판단하여, 상기 기계학습 데이터 특징 정보의 유효성을 검증하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
4 |
4
제3항에 있어서, 상기 기계학습 데이터 특징 정보는, 행렬 크기 설정 인자, 스칼라 값 및 전치행렬 여부 정보 중 적어도 어느 하나를 포함하며, 상기 BLAS 연산의 종류에 따라 상이한 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
5 |
5
제1항에 있어서, 상기 OpenCL 파라미터는, 벡터 그룹화 수, 워크 그룹의 크기, 메모리 매핑 적용 여부, 통합 메모리 구조 지원 여부, 로컬 메모리 지원 여부 및 로컬 메모리 크기 중 적어도 어느 하나에 대한 파라미터를 포함하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
6 |
6
제1항에 있어서, 상기 OpenCL 실행부는, 메모리 매핑 적용 여부가 설정되어 있는 경우, 메모리 매핑 함수를 이용하여 상기 임베디드 시스템의 CPU가 상기 BLAS 연산의 수행 결과에 바로 접근 가능하도록 하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
7 |
7
제6항에 있어서, 상기 OpenCL 실행부는, 상기 메모리 매핑 적용 여부가 설정되어 있지 않은 경우, OpenCL의 버퍼 읽기 함수를 이용하여 상기 GPU의 메모리 영역에서 CPU의 메모리 영역으로 상기 BLAS 연산의 수행 결과를 복사하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
8 |
8
제5항에 있어서, 상기 BLAS 연산 가속화부는, 상기 BLAS 연산의 종류 및 상기 기계학습 데이터 특징 정보를 기반으로 상기 BLAS 연산에 상응하는 템플릿을 선택하고, 선택된 상기 템플릿에서 상기 OpenCL 파라미터에 상응하는 커널 소스코드를 생성하며, 상기 커널 소스코드를 컴파일하여 상기 바이너리 형태의 커널을 생성하는 단계를 포함하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
9 |
9
제8항에 있어서, 상기 OpenCL 실행부는, 기계학습의 데이터가 일정한 경우, 상기 BLAS 연산의 수행 시간을 최소화하기 위하여 기 생성된 상기 커널을 재사용하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
10 |
10
제5항에 있어서, 상기 BLAS 연산 가속화부는, OpenCL 장치가 로컬 메모리를 지원하는 경우, 상기 OpenCL 파라미터의 상기 로컬 메모리 크기를 기반으로 로컬 메모리에 복사할 데이터의 크기를 지정하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
11 |
11
임베디드 시스템에서의 기계학습 알고리즘에서 BLAS 연산을 호출하면, 상기 기계학습 알고리즘에 상응하는 기계학습 데이터 특징 정보를 BLAS 연산 가속화부로 전달하는 가속 장치 응용부, 상기 가속 장치 응용부로부터 전달받은 상기 기계학습 데이터 특징 정보 및 OpenCL 장치 정보를 기반으로 상기 임베디드 시스템에 대한 OpenCL 실행 환경을 설정하고, OpenCL 파라미터 및 커널을 생성하는 BLAS 연산 가속화부, 그리고 GPU가 상기 OpenCL 파라미터 및 상기 커널을 통해 가속화된 상기 BLAS 연산을 수행하고, 상기 BLAS 연산의 수행 결과를 상기 가속 장치 응용부를 통해 상기 기계학습 알고리즘에 반환하는 OpenCL 실행부를 포함하는 GPU 기반의 적응적 BLAS 연산 가속화 장치
|
12 |
12
GPU 기반의 적응적 BLAS 연산 가속화 장치에 의해 수행되는 GPU 기반의 적응적 BLAS 연산 가속화 방법에 있어서, 기계학습 데이터 특징 정보 및 OpenCL 장치 정보를 이용하여, 최적 OpenCL 파라미터를 설정하는 단계, 커널 소스코드를 컴파일하여 바이너리 형태의 커널을 생성하는 단계, OpenCL 실행 환경 정보 및 상기 최적 OpenCL 파라미터를 이용하여 BLAS 연산을 위한 OpenCL 버퍼를 생성하는 단계, 임베디드 시스템에서의 기계학습을 가속화하기 위하여, 생성된 상기 OpenCL 버퍼에 접근 가능한 GPU가 커널을 통해 상기 BLAS 연산을 수행하는 단계, 그리고 상기 BLAS 연산의 수행 결과를 기계학습 알고리즘에 반환하는 단계를 포함하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
13 |
13
제12항에 있어서, 상기 OpenCL 장치 정보는, 초기 분석 과정 수행 시 생성된 것으로, 상기 임베디드 시스템의 로컬 파일 시스템에 저장되고, 상기 임베디드 시스템에서 상기 기계학습을 수행할 때마다 상기 OpenCL 파라미터의 설정에 활용되는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
14 |
14
제12항에 있어서, 상기 기계학습 데이터 특징 정보는, 행렬 크기 설정 인자, 스칼라 값 및 전치행렬 여부 정보 중 적어도 어느 하나를 포함하며, 상기 BLAS 연산의 종류에 따라 상이한 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
15 |
15
제12항에 있어서, 입력된 행렬 크기 값 및 데이터 유형을 기반으로, 상기 기계학습 데이터 특징 정보가 실제 데이터의 크기와 일치하는지 판단하여, 상기 기계학습 데이터 특징 정보의 유효성을 검증하는 단계를 더 포함하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
16 |
16
제12항에 있어서, 상기 OpenCL 파라미터는, 벡터 그룹화 수, 워크 그룹의 크기, 메모리 매핑 적용 여부, 통합 메모리 구조 지원 여부, 로컬 메모리 지원 여부 및 로컬 메모리 크기 중 적어도 어느 하나에 대한 파라미터를 포함하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
17 |
17
제12항에 있어서, 상기 BLAS 연산의 수행 결과를 기계학습 알고리즘에 반환하는 단계는, 메모리 매핑 적용 여부가 설정되어 있는 경우, 메모리 매핑 함수를 이용하여 상기 임베디드 시스템의 CPU가 상기 BLAS 연산의 수행 결과에 바로 접근 가능하도록 하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
18 |
18
제17항에 있어서, 상기 BLAS 연산의 수행 결과를 기계학습 알고리즘에 반환하는 단계는,상기 메모리 매핑 적용 여부가 설정되어 있지 않은 경우, OpenCL의 버퍼 읽기 함수를 이용하여 상기 GPU의 메모리 영역에서 CPU의 메모리 영역으로 상기 BLAS 연산의 수행 결과를 복사하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
19 |
19
제16항에 있어서, 상기 커널 소스코드를 컴파일하여 바이너리 형태의 커널을 생성하는 단계는, 상기 BLAS 연산의 종류 및 상기 기계학습 데이터 특징 정보를 기반으로 상기 BLAS 연산에 상응하는 템플릿을 선택하는 단계, 선택된 상기 템플릿에서 상기 OpenCL 파라미터에 상응하는 커널 소스코드를 생성하는 단계, 그리고 상기 커널 소스코드를 컴파일하여, 상기 바이너리 형태의 커널을 생성하는 단계를 포함하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|
20 |
20
제19항에 있어서, 기계학습의 데이터가 일정한 경우, 상기 BLAS 연산의 수행 시간을 최소화하기 위하여 기 생성된 상기 커널을 재사용하는 것을 특징으로 하는 GPU 기반의 적응적 BLAS 연산 가속화 방법
|