맞춤기술찾기

이전대상기술

딥러닝 기반 추천 시스템에서 메모리 크기와 에너지를 줄일 수 있는 임베딩의 니어-메모리 프로세싱 방법 및 시스템

  • 기술번호 : KST2023002664
  • 담당센터 : 인천기술혁신센터
  • 전화번호 : 032-420-3580
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 하이브리드 니어 메모리 프로세싱 시스템 및 그 동작 방법이 제시된다. 본 발명에서 제안하는 하이브리드 니어 메모리 프로세싱 시스템은 GPU, PIM-HBM, CPU 및 메인 메모리를 포함하고, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 상기 메인 메모리와 상기 HBM에 나누어 저장하고, 상기 추천 시스템의 추론 과정에서 필요한 임베딩 벡터의 위치에 따라 상기 메인 메모리 또는 상기 HBM에서 임베딩 룩업 작업이 각각 수행되며, 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되고, 임베딩 매니퓰레이션을 통해 처리된 임베딩 벡터들은 상기 PIM 에서 최종적으로 병합(concatenation)되어 임베딩 결과를 생성하고, 상기 임베딩 결과는 상기 GPU로 전달되어 상위 MLP(top Multilayer Perceptron) 과정을 통해 최종 추론 결과를 도출한다.
Int. CL G06N 3/063 (2023.01.01) G06N 3/08 (2023.01.01) G06N 5/04 (2023.01.01) G06F 15/78 (2006.01.01)
CPC G06N 3/063(2013.01) G06N 3/084(2013.01) G06N 5/04(2013.01) G06F 15/7821(2013.01)
출원번호/일자 1020220085533 (2022.07.12)
출원인 인하대학교 산학협력단
등록번호/일자 10-2515159-0000 (2023.03.23)
공개번호/일자
공고번호/일자 (20230329) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.07.12)
심사청구항수 8

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 인하대학교 산학협력단 대한민국 인천광역시 미추홀구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 이채은 서울특별시 서초구
2 조명근 경기도 수원시 권선구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 인하대학교 산학협력단 인천광역시 미추홀구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.07.12 수리 (Accepted) 1-1-2022-0724355-26
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.07.12 수리 (Accepted) 1-1-2022-0725856-67
3 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.10.04 수리 (Accepted) 1-1-2022-1039227-35
4 [우선심사신청]심사청구서·우선심사신청서
2022.12.06 수리 (Accepted) 1-1-2022-1310221-08
5 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2022.12.06 수리 (Accepted) 1-1-2022-1312459-03
6 [우선심사신청]선행기술조사의뢰서
[Request for Preferential Examination] Request for Prior Art Search
2022.12.10 수리 (Accepted) 9-1-9999-9999999-89
7 [우선심사신청]선행기술조사보고서
[Request for Preferential Examination] Report of Prior Art Search
2022.12.16 수리 (Accepted) 9-1-2022-0019872-25
8 의견제출통지서
Notification of reason for refusal
2022.12.29 발송처리완료 (Completion of Transmission) 9-5-2022-1026016-51
9 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2023.01.11 수리 (Accepted) 1-1-2023-0040840-49
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2023.01.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2023-0040841-95
11 등록결정서
Decision to grant
2023.03.22 발송처리완료 (Completion of Transmission) 9-5-2023-0271556-85
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
하이브리드 니어 메모리 프로세싱 시스템에 있어서, GPU, PIM-HBM, CPU 및 메인 메모리를 포함하고, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 상기 메인 메모리와 상기 HBM에 나누어 저장하고, 상기 추천 시스템의 추론 과정에서 필요한 임베딩 벡터의 위치에 따라 상기 메인 메모리 또는 상기 HBM에서 임베딩 룩업 작업이 각각 수행되며, 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되고, 임베딩 매니퓰레이션을 통해 처리된 임베딩 벡터들은 상기 PIM 에서 최종적으로 병합(concatenation)되어 임베딩 결과를 생성하고, 상기 임베딩 결과는 상기 GPU로 전달되어 상위 MLP(top Multilayer Perceptron) 과정을 통해 최종 추론 결과를 도출하며, 메모리 대역폭을 증가시키고, 메모리 용량 부족 문제를 해결하기 위해 상기 임베딩 테이블의 접근 횟수에 따라 핫 임베딩 벡터는 상기 HBM에 저장하고, 콜드 임베딩 벡터는 메인 메모리에 저장하는 데이터 오프로딩(data offloading) 저장 방식을 이용하는 하이브리드 니어 메모리 프로세싱 시스템
2 2
제1항에 있어서,상기 데이터 오프로딩(data offloading) 저장 방식을 이용하기 위해 컴포셔널 임베딩(compositional embeddings)을 통해 사전 학습(post training)을 수행하고, 상기 사전 학습은 해시 충돌에 따른 최적의 임베딩 벡터의 데이터 수를 설정하여 메인 메모리와 HBM에 저장될 임베딩 벡터의 데이터 수를 구분하는 과정 및 불필요한 해시 함수의 계산 과정을 줄이기 위해 원본 임베딩 테이블과 같은 형태로 메인 메모리에 저장될 임베딩 테이블을 통합하는 과정을 포함하는 하이브리드 니어 메모리 프로세싱 시스템
3 3
하이브리드 니어 메모리 프로세싱 시스템에 있어서, GPU, PIM-HBM, CPU 및 메인 메모리를 포함하고, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 상기 메인 메모리와 상기 HBM에 나누어 저장하고, 상기 추천 시스템의 추론 과정에서 필요한 임베딩 벡터의 위치에 따라 상기 메인 메모리 또는 상기 HBM에서 임베딩 룩업 작업이 각각 수행되며, 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되고, 임베딩 매니퓰레이션을 통해 처리된 임베딩 벡터들은 상기 PIM 에서 최종적으로 병합(concatenation)되어 임베딩 결과를 생성하고, 상기 임베딩 결과는 상기 GPU로 전달되어 상위 MLP(top Multilayer Perceptron) 과정을 통해 최종 추론 결과를 도출하며, 상기 PIM을 이용한 해시 계산을 통해 임베딩 룩업을 처리하는 태스크 오프로딩(task offloading) 방식을 수행하고, 상기 태스크 오프로딩은 입력 인덱스가 입력되면 상기 PIM에서 해시 계산을 통해 Q 테이블과 R 테이블 각각에 대한 인덱스를 구하고, 상기 인덱스를 이용하여 Q 테이블과 R 테이블 각각에서 임베딩 벡터를 불러오고, 상기 불러온 임베딩 벡터에 대한 임베딩 매니퓰레이션 과정을 거쳐 최종 임베딩 벡터를 생성하는 하이브리드 니어 메모리 프로세싱 시스템
4 4
제3항에 있어서,상기 임베딩 매니퓰레이션은 임베딩 데이터셋에 따라 원 핫 임베딩(one hot embedding)의 경우 불러온 임베딩 벡터를 병합(concatenate)하여 처리하고, 다중 핫 임베딩(multi hot embedding)의 경우 벡터 간의 연산을 통해 최종 임베딩 벡터를 생성하는 하이브리드 니어 메모리 프로세싱 시스템
5 5
GPU, PIM-HBM, CPU 및 메인 메모리를 포함하는 하이브리드 니어 메모리 프로세싱 시스템의 동작 방법에 있어서, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 데이터 특성에 따라 상기 메인 메모리와 상기 HBM에 나누어 저장하는 사전 학습 단계; 상기 추천 시스템의 추론 과정에서 필요한 임베딩 벡터의 위치에 따라 상기 메인 메모리 또는 상기 HBM에서 임베딩 룩업 작업이 각각 수행되는 단계; 상기 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되는 단계; 및 상기 임베딩 매니퓰레이션을 통해 처리된 임베딩 벡터들이 상기 PIM 에서 최종적으로 병합(concatenation)되어 임베딩 결과를 생성하고, 상기 임베딩 결과는 상기 GPU로 전달되어 상위 MLP(top Multilayer Perceptron) 과정을 통해 최종 추론 결과를 도출하는 단계를 포함하고, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 데이터 특성에 따라 상기 메인 메모리와 상기 HBM에 나누어 저장하는 사전 학습 단계는, 메모리 대역폭을 증가시키고, 메모리 용량 부족 문제를 해결하기 위해 상기 임베딩 테이블의 접근 횟수에 따라 핫 임베딩 벡터는 상기 HBM에 저장하고, 콜드 임베딩 벡터는 메인 메모리에 저장하는 데이터 오프로딩(data offloading) 저장 방식을 이용하는 하이브리드 니어 메모리 프로세싱 방법
6 6
제5항에 있어서,상기 데이터 오프로딩(data offloading) 저장 방식을 이용하기 위해 컴포셔널 임베딩(compositional embeddings)을 통해 사전 학습(post training)을 수행하고, 상기 사전 학습은 해시 충돌에 따른 최적의 임베딩 벡터의 데이터 수를 설정하여 메인 메모리와 HBM에 저장될 임베딩 벡터의 데이터 수를 구분하는 과정 및 불필요한 해시 함수의 계산 과정을 줄이기 위해 원본 임베딩 테이블과 같은 형태로 메인 메모리에 저장될 임베딩 테이블을 통합하는 과정을 포함하는 하이브리드 니어 메모리 프로세싱 방법
7 7
GPU, PIM-HBM, CPU 및 메인 메모리를 포함하는 하이브리드 니어 메모리 프로세싱 시스템의 동작 방법에 있어서, 상기 GPU, PIM-HBM 를 통해 임베딩 벡터를 불러오고, 추천 시스템의 추론을 위한 훈련 과정에서 임베딩 테이블을 데이터 특성에 따라 상기 메인 메모리와 상기 HBM에 나누어 저장하는 사전 학습 단계; 상기 추천 시스템의 추론 과정에서 필요한 임베딩 벡터의 위치에 따라 상기 메인 메모리 또는 상기 HBM에서 임베딩 룩업 작업이 각각 수행되는 단계; 상기 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되는 단계; 및 상기 임베딩 매니퓰레이션을 통해 처리된 임베딩 벡터들이 상기 PIM 에서 최종적으로 병합(concatenation)되어 임베딩 결과를 생성하고, 상기 임베딩 결과는 상기 GPU로 전달되어 상위 MLP(top Multilayer Perceptron) 과정을 통해 최종 추론 결과를 도출하는 단계를 포함하고, 상기 임베딩 룩업 작업이 완료된 임베딩 벡터에 대하여 상기 CPU와 상기 PIM에서 추가적인 임베딩 매니퓰레이션(embedding manipulation) 작업이 수행되는 단계는, 상기 PIM을 이용한 해시 계산을 통해 임베딩 룩업을 처리하는 태스크 오프로딩(task offloading) 방식을 수행하고, 상기 태스크 오프로딩은 입력 인덱스가 입력되면 상기 PIM에서 해시 계산을 통해 Q 테이블과 R 테이블 각각에 대한 인덱스를 구하고, 상기 인덱스를 이용하여 Q 테이블과 R 테이블 각각에서 임베딩 벡터를 불러오고, 상기 불러온 임베딩 벡터에 대한 임베딩 매니퓰레이션 과정을 거쳐 최종 임베딩 벡터를 생성하는하이브리드 니어 메모리 프로세싱 방법
8 8
제7항에 있어서,상기 임베딩 매니퓰레이션은 임베딩 데이터셋에 따라 원 핫 임베딩(one hot embedding)의 경우 불러온 임베딩 벡터를 병합(concatenate)하여 처리하고, 다중 핫 임베딩(multi hot embedding)의 경우 벡터 간의 연산을 통해 최종 임베딩 벡터를 생성하는 하이브리드 니어 메모리 프로세싱 방법
9 9
삭제
10 10
삭제
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 인하대학교 산학협력단 대학ICT연구센터육성지원사업 스마트 모빌리티를 위한 인공지능 시스템반도체 핵심 기술 개발 및 인력 양성