맞춤기술찾기

이전대상기술

딥 러닝 추론 성능 개선 방법

  • 기술번호 : KST2022019679
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 커널이슈 개수 L-1(L은 2 이상의 정수)에 대해, N(N은 2 이상의 정수) 개의 커널 생성시간과 M(M은 2 이상의 정수) 개의 커널 수행시간의 각각의 조합을 AP의 호스트와 모바일 GPU에서 수행하고 각각의 조합에 대응하는 KLO 값을 결정하는 단계 및 커널이슈 개수 L에 대해, N 개의 커널 생성시간과 M 개의 커널 수행시간의 각각의 조합을 AP의 호스트와 모바일 GPU에서 수행하고 각각의 조합에 대응하는 KLO 값을 결정하는 단계를 포함하는 딥 러닝 추론 성능 개선 방법에 관한 것이다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01) G06N 20/10 (2019.01.01) G06N 5/04 (2006.01.01)
CPC G06N 3/08(2013.01) G06N 3/0454(2013.01) G06N 20/10(2013.01) G06N 5/04(2013.01)
출원번호/일자 1020210037000 (2021.03.23)
출원인 서울시립대학교 산학협력단
등록번호/일자
공개번호/일자 10-2022-0132121 (2022.09.30) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.03.23)
심사청구항수 13

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울시립대학교 산학협력단 대한민국 서울특별시 동대문구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이영민 서울특별시 서대문구
2 김수민 서울특별시 동대문구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 이강녕 대한민국 경기도 안양시 동안구 시민대로***번길 * (관양동) 대명 글로벌 비즈스퀘어 ***호(이도특허사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.03.23 수리 (Accepted) 1-1-2021-0336999-28
2 특허고객번호 정보변경(경정)신고서·정정신고서
2022.01.25 수리 (Accepted) 4-1-2022-5020718-60
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
모바일 GPU를 포함하는 AP가 수행하는 딥 러닝 추론 성능 개선 방법으로서, 커널이슈 개수 L-1(L은 2 이상의 정수)에 대해, N(N은 2 이상의 정수) 개의 커널 생성시간과 M(M은 2 이상의 정수) 개의 커널 수행시간의 각각의 조합을 상기 AP의 호스트와 상기 모바일 GPU에서 수행하고 각각의 조합에 대응하는 KLO 값을 결정하는 단계; 및 커널이슈 개수 L에 대해, 상기 N 개의 커널 생성시간과 상기 M 개의 커널 수행시간의 각각의 조합을 상기 AP의 상기 호스트와 상기 모바일 GPU에서 수행하고 각각의 조합에 대응하는 KLO 값을 결정하는 단계;를 포함하는, 딥 러닝 추론 성능 개선 방법
2 2
제1항에 있어서, 커널이슈 개수 L-1의 결정된 KLO 값을 포함하는 L-1 KLO 테이블과 커널이슈 개수 L의 결정된 KLO 값을 포함하는 L KLO 테이블로부터 상기 N 개의 커널 생성시간과 상기 M 개의 커널 수행시간의 각각의 조합에 대응하는 커널이슈 개수를 특정할 수 있는 커널이슈 정보를 생성하는 단계;를 더 포함하는,딥 러닝 추론 성능 개선 방법
3 3
제2항에 있어서, 상기 커널이슈 정보를 생성하는 단계는 상기 N 개의 커널 생성시간과 상기 M 개의 커널 수행시간의 각각의 조합의 L-1 KLO 값과 L KLO 값 중 가장 낮은 KLO 값을 가지는 커널이슈 개수 L-1 또는 커널이슈 개수 L을 상기 N 개의 커널 생성시간과 상기 M 개의 커널 수행시간의 각각의 조합에 대응시키는, 딥 러닝 추론 성능 개선 방법
4 4
제3항에 있어서, 상기 커널이슈 정보를 생성하는 단계는 각각의 커널 수행시간별 커널 생성시간에 대한 KLO 그래프를 특정할 수 있는 그래프 인자를 저장하는, 딥 러닝 추론 성능 개선 방법
5 5
제3항에 있어서, 상기 커널이슈 정보를 생성하는 단계는 1에서 L개의 KLO 테이블로부터 각각의 커널 생성시간과 각각의 커널 수행시간의 KLO 값 중 가장 낮은 KLO 값을 가지는 커널이슈 개수를 커널 생성시간과 커널 수행시간의 인덱싱에 따라 룩업할 수 있는 룩업 테이블을 생성하는, 딥 러닝 추론 성능 개선 방법
6 6
모바일 GPU를 포함하는 AP에서 수행되는 딥 러닝 추론 성능 개선 방법으로서, 상기 AP에서의 실행을 통해 제1 CNN 모델을 프로파일링하여 상기 제1 CNN 모델의 순차적으로 수행되는 복수의 커널별 커널 수행시간을 측정하는 단계; 및 상기 AP에서의 수행을 통해 생성되는 커널이슈 정보와 측정된 상기 복수의 커널별 수행시간을 이용하여 상기 제1 CNN 모델에 대한 제1 커널이슈 개수를 결정하는 단계;를 포함하는, 딥 러닝 추론 성능 개선 방법
7 7
제6항에 있어서, 상기 커널이슈 정보는 제2항을 통해 생성되는 커널이슈 정보인, 딥 러닝 추론 성능 개선 방법
8 8
제6항에 있어서,상기 AP에서의 실행을 통해 제2 CNN 모델을 통해 프로파일링하여 상기 제2 CNN 모델의 순차적으로 수행되는 복수의 커널별 커널 수행시간을 측정하는 단계; 및 상기 AP를 대상으로 한 상기 커널이슈 정보와 측정된 상기 복수의 커널별 커널 수행시간을 이용하여 상기 제2 CNN 모델에 대한 제2 커널이슈 개수를 결정하는 단계;를 포함하고,상기 제1 커널이슈 개수는 상기 AP에서 상기 제1 CNN 모델의 실행시에 호스트로부터 모바일 GPU로 이슈하는 커널의 개수이고 상기 제2 커널이슈 개수는 상기 AP에서 상기 제2 CNN 모델의 실행시에 호스트로부터 모바일 GPU로 이슈하는 커널의 개수인, 딥 러닝 추론 성능 개선 방법
9 9
제6항에 있어서, 상기 복수의 커널별 커널 수행시간을 측정하는 단계는 복수의 커널별 커널 생성시간을 더 측정하고, 상기 제1 CNN 모델에 대한 제1 커널이슈 개수를 결정하는 단계는, 입력 데이터에 대한 상기 제1 CNN 모델의 실행을 통한 딥 러닝 추론 이전에, 상기 복수의 커널별 커널 수행시간으로부터 커널 평균수행시간과 상기 복수의 커널별 커널 생성시간으로부터 커널 평균생성시간을 산출하고 산출된 커널 평균수행시간과 산출된 커널 평균생성시간에 대응하는 제1 커널이슈 개수를 커널이슈 정보로부터 정적으로 결정하는, 딥 러닝 추론 성능 개선 방법
10 10
제6항에 있어서, 상기 복수의 커널별 커널 수행시간을 측정하는 단계는 복수의 커널별 커널 생성시간을 더 측정하고, 상기 제1 CNN 모델에 대한 제1 커널이슈 개수를 결정하는 단계는, 입력 데이터에 대한 상기 제1 CNN 모델의 실행을 통한 딥 러닝 추론 이전에, 상기 복수의 커널별 커널 수행시간과 상기 복수의 커널별 커널 생성시간으로부터 순차적으로 수행되는 복수의 커널에서의 순차적으로 모바일 GPU로 이슈되는 커널 개수인 복수의 제1 커널이슈 개수를 커널이슈 정보로부터 정적으로 결정하는, 딥 러닝 추론 성능 개선 방법
11 11
제6항에 있어서, 상기 제1 CNN 모델에 대한 제1 커널이슈 개수를 결정하는 단계는, 입력 데이터에 대한 상기 제1 CNN 모델의 실행을 통한 딥 러닝 추론 동안에, 실시간으로 현재 커널의 커널 생성시간을 측정하고 실시간 측정된 커널 생성시간과 현재 커널에 대응하여 미리 측정된 커널 수행시간에 대응하는 제1 커널이슈 개수를 커널이슈 정보로부터 동적으로 결정하는, 딥 러닝 추론 성능 개선 방법
12 12
제9항 또는 제10항에 있어서, 결정된 제1 커널이슈 개수를 이용한 제1 CNN 모델의 상기 AP에서 실행을 통해 입력 데이터에 대한 딥 러닝 추론을 수행하는 단계;를 더 포함하는, 딥 러닝 추론 성능 개선 방법
13 13
제9항 내지 제11항 중 어느 한 항에 있어서, 상기 커널이슈 정보는 커널 생성시간과 커널 수행시간의 인덱싱에 따라 커널이슈 개수를 룩업할 수 있는 룩업 테이블인,딥 러닝 추론 성능 개선 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.