1 |
1
프로세서(processor); 및프로세서를 통해 실행되는 적어도 하나의 명령이 저장된 메모리(memory); 를 포함하고, 상기 적어도 하나의 명령은 상기 프로세서가: 유저 및 아이템을 k 차원의 잠재 특징(latent feature) 공간에 매핑(mapping) 시키는 단계;학습 데이터에 속하는 임의의 평점/유저 및 아이템 정보가 들어오면, 대응되는 유저 및 아이템 잠재 특징(latent feature) 벡터를 각각 메모리에서 읽는 단계;두 벡터의 내적으로 예측 평점을 구하고, 이를 기반으로 예측 오차를 구하는 단계; 및예측 오차를 줄이는 방향으로 유저 및 아이템 잠재 특징(latent feature)를 업데이트하는 단계; 를 수행하도록 구성되는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
2 |
2
청구항 1에 있어서, 상기 장치는,유저 및 아이템 잠재 특징 벡터(latent feature vector) 파라미터를 저장할 때, 단정밀도 부동소수점(32 bit floating point, FP32)뿐만 아니라, 반정밀도(16 bit floating point, FP16)까지 사용하여 메모리 접근 속도를 가속화하는 메모리 기반 양자화부; 를 포함하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
3 |
3
청구항 2에 있어서, 상기 장치는,평점 수 기준으로 유저 및 아이템 그룹을 나누고 에러 값과 해당 그룹의 정밀도를 제어하여 모델 정확도를 보존하는 유저 및 아이템 그룹 기반 정밀도 변환부; 를 포함하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
4 |
4
청구항 3에 있어서, 유저 및 아이템 그룹 기반 정밀도 변환부는,유저 및 아이템을 평점 수를 기준으로 그룹화하고, 그레디언트 다이버시티(gradient diversity)라는 메트릭을 사용하여 학습 시 그룹 별 에러를 체크하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
5 |
5
청구항 4에 있어서, 유저 및 아이템 그룹 기반 정밀도 변환부는,특정 시점에 양자화로 인한 에러가 큰 그룹을 FP32로 변환하여 학습을 진행함으로써 모델 정확도를 유지하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
6 |
6
청구항 3에 있어서, 유저 및 아이템 그룹 기반 정밀도 변환부는,특정 시점에 양자화로 인한 에러가 작은 그룹은 FP16으로 학습함으로써 FP16 활용으로 인한 가속화 효과를 활용하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
7 |
7
청구항 1에 있어서, 상기 장치는,유저 및 아이템 그룹 별 메타 정보를 빠르게 접근할 수 있는 캐시와 레지스터에 관리하여, 학습 시 발생하는 오버헤드를 줄이는 캐시 및 레지스터 기반 그룹 메타 정보 관리부; 를 포함하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
8 |
8
청구항 7에 있어서, 캐시 및 레지스터 기반 그룹 메타 정보 관리부는,유저 및 아이템이 어느 그룹에 속했는지에 대한 인덱스 정보;특정 그룹의 정밀도 정보; 및양자화 에러 정보; 를 포함하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
9 |
9
청구항 7에 있어서, 캐시 및 레지스터 기반 그룹 메타 정보 관리부는,인덱스 정보, 정밀도 정보, 양자화 에러 정보를 캐시에 저장하고,인덱스 정보, 정밀도 정보, 양자화 에러 정보 중 가장 빈번하게 접근되는 일부 그룹의 인덱스 정보를 레지스터에 저장하고,평점 수가 많은 일부 그룹의 인덱스 정보만을 선별하여 레지스터에 적재하게 되는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 장치
|
10 |
10
유저 및 아이템을 k 차원의 잠재 특징(latent feature) 공간에 매핑(mapping) 시키는 단계;학습 데이터에 속하는 임의의 평점/유저 및 아이템 정보가 들어오면, 대응되는 유저 및 아이템 잠재 특징(latent feature) 벡터를 각각 메모리에서 읽는 단계;두 벡터의 내적으로 예측 평점을 구하고, 이를 기반으로 예측 오차를 구하는 단계; 및예측 오차를 줄이는 방향으로 유저 및 아이템 잠재 특징(latent feature)을 업데이트하는 단계; 를 포함하는,추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 학습 방법
|
11 |
11
청구항 10의 추천시스템에서의 효율적인 행렬 분해를 위한 양자화 프레임워크 학습 방법의 프로그램을 구현하기 위한 컴퓨터 판독 가능한 기록매체
|