맞춤기술찾기

이전대상기술

파라미터의 민감도에 기초하여 복수의 트랜스포머 인코더 레이어를 양자화하는 방법 및 장치

  • 기술번호 : KST2022008843
  • 담당센터 : 서울동부기술혁신센터
  • 전화번호 : 02-2155-3662
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 복수의 트랜스포머 인코더 레이어를 포함하는 뉴럴 네트워크에서 양자화를 수행하는 방법에 있어서, 상기 복수의 트랜스포머 인코더 레이어를 파라미터의 민감도에 기초하여 적어도 하나의 상기 트랜스포머 인코더 레이어를 포함하는 그룹들로 분할하는 단계 및 분할된 그룹별로 결정된 양자화 방법을 적용하는 단계를 포함한다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01)
CPC G06N 3/08(2013.01) G06N 3/04(2013.01)
출원번호/일자 1020200183411 (2020.12.24)
출원인 서울대학교산학협력단
등록번호/일자
공개번호/일자 10-2022-0092043 (2022.07.01) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.12.24)
심사청구항수 18

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 강유 서울특별시 서초구
2 박태임 대한민국 ***** 서울특
3 조익현 서울특별시 서초구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인 아이스퀘어 대한민국 서울특별시 강남구 선릉로 ***, **층 ***호(대치동)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.12.24 수리 (Accepted) 1-1-2020-1410970-19
2 특허고객번호 정보변경(경정)신고서·정정신고서
2021.07.29 수리 (Accepted) 4-1-2021-5205564-29
3 특허고객번호 정보변경(경정)신고서·정정신고서
2022.04.04 수리 (Accepted) 4-1-2022-5079741-71
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
복수의 트랜스포머 인코더 레이어를 포함하는 뉴럴 네트워크에서 양자화를 수행하는 방법에 있어서,상기 복수의 트랜스포머 인코더 레이어를 파라미터의 민감도에 기초하여 적어도 하나의 상기 트랜스포머 인코더 레이어를 포함하는 그룹들로 분할하는 단계; 분할된 그룹별로 결정된 양자화 방법을 적용하는 단계를 포함하는, 방법
2 2
제1항에 있어서,상기 복수의 트랜스포머 인코더 레이어의 파라미터의 민감도에 기초하여 적어도 하나의 그룹들로 분할하는 단계는,상기 복수의 트랜스포머 인코더 레이어를 최초 입력에 가까운 순서대로 미리 설정된 개수의 레이어를 제1그룹으로, 나머지 레이어를 제2그룹으로 분할하는, 방법
3 3
제2항에 있어서, 분할된 그룹별로 결정된 양자화 방법을 적용하는 단계는,최초 입력에 가까운 상기 제1그룹은 8 비트 인덱스 양자화를 적용하여 각각 양자화된 피드 포워드 네트워크와 셀프어텐션 레이어를 포함한 8 비트 인코더 레이어로 양자화하고, 최종 출력에 가까운 상기 제2그룹은 1 비트 양자화를 적용하여 양자화된 피드 포워드 네트워크와 8비트 인덱스 양자화를 적용하여 양자화된 셀프어텐션 레이어를 포함한 MP 인코더 레이어로 양자화하는, 방법
4 4
제 3항에 있어서,상기 8비트 인덱스 양자화는,순방향 전파에서 8 비트 인덱스를 사용하여 양자화와 역-양자화를 순차적으로 적용하는 단계; 및역방향 전파에서 8 비트 클립 함수를 사용하여 가중치를 학습시키는 단계를 포함하는, 방법
5 5
제3항에 있어서,상기 1 비트 양자화는,순방향 전파에서 sign 함수를 이용하여 양자화하는 단계; 및역방향 전파에서 1 비트 클립 함수를 사용하여 가중치를 학습시키는 단계를 포함하는, 방법
6 6
제5항에 있어서,상기 1 비트 양자화는,파라미터의 각 절대값을 1에 가깝게 학습하는 절대 이진 가중치 정규화(Absolute Binary Weight Regularization)를 수행하는 단계를 더 포함하는, 방법
7 7
제5항에 있어서,상기 1 비트 양자화는,상기 1 비트 양자화를 수행하기 전에, FP32 형식의 가중치가 입력의 이진 특성을 학습하도록 하는 이진화 특징 우선 학습(Prioritized Training)을 수행하는 단계를 더 포함하는, 방법
8 8
제5항에 있어서,상기 1 비트 양자화는,학습단계에서 레이어 별 재학습(Layer-wise Fine-Tuning)을 적용하는 단계를 더 포함하는, 방법
9 9
복수의 트랜스포머 인코더 레이어를 포함하는 뉴럴 네트워크에서 양자화를 수행하는 장치에 있어서,양자화를 수행하는 프로그램이 저장되는 저장부; 및적어도 하나의 프로세서를 포함하는 제어부를 포함하며,상기 제어부는,상기 복수의 트랜스포머 인코더 레이어를 파라미터의 민감도에 기초하여 적어도 하나의 상기 트랜스포머 인코더 레이어를 포함하는 그룹들로 분할하며, 분할된 그룹별로 결정된 양자화 방법을 적용하는, 장치
10 10
제9항에 있어서,상기 제어부는,상기 복수의 트랜스포머 인코더 레이어를 최초 입력에 가까운 순서대로 미리 설정된 개수의 레이어를 제1그룹으로, 나머지 레이어를 제2그룹으로 분할하는, 장치
11 11
제10항에 있어서,상기 제어부는,최초 입력에 가까운 상기 제1그룹은 8 비트 인덱스 양자화를 적용하여 각각 양자화된 피드 포워드 네트워크와 셀프어텐션 레이어를 포함한 8 비트 인코더 레이어로 양자화하고, 최종 출력에 가까운 상기 제2그룹은 1 비트 양자화를 적용하여 양자화된 피드 포워드 네트워크와 8비트 인덱스 양자화를 적용하여 양자화된 셀프어텐션 레이어를 포함한 MP 인코더 레이어로 양자화하는, 장치
12 12
제11항에 있어서,상기 제어부는,상기 8비트 인덱스 양자화를 하되,순방향 전파에서 8 비트 인덱스를 사용하여 양자화와 역-양자화를 순차적으로 적용하고,역방향 전파에서 8 비트 클립 함수를 사용하여 가중치를 학습시키는, 장치
13 13
제11항에 있어서,상기 제어부는,상기 1 비트 양자화를 하되,순방향 전파에서 sign 함수를 이용하여 양자화하고,역방향 전파에서 1 비트 클립 함수를 사용하여 가중치를 학습시키는, 장치
14 14
제13항에 있어서,상기 제어부는,상기 1 비트 양자화를 하되,파라미터의 각 절대값을 1에 가깝게 학습하는 절대 이진 가중치 정규화(Absolute Binary Weight Regularization)를 수행하는, 장치
15 15
제13항에 있어서,상기 제어부는,상기 1 비트 양자화를 하되,상기 1 비트 양자화를 수행하기 전에, FP32 형식의 가중치가 입력의 이진 특성을 학습하도록 하는 이진화 특징 우선 학습(Prioritized Training)을 수행하는, 장치
16 16
제13항에 있어서,상기 제어부는,상기 1 비트 양자화를 하되,학습단계에서 레이어 별 재학습(Layer-Wise Fine-Tuning)을 적용하는, 장치
17 17
컴퓨터에 제1항에 기재된 방법을 실행시키기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록 매체
18 18
파라미터의 민감도에 기초하여 복수의 트랜스포머 인코더 레이어를 양자화하는 장치에 의해 수행되며, 제1항에 기재된 방법을 수행하기 위해 매체에 저장된 컴퓨터 프로그램
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 서울대학교 산학협력단 혁신성장동력프로젝트 비디오 튜링 테스트를 통과할 수준의 비디오 스토리 이해 기반의 질의응답 기술 개발
2 과학기술정보통신부 서울대학교 산학협력단 SW컴퓨팅산업원천기술개발(R&D,정보화) (SW 스타랩) 다양한 응용과 환경을 지원하는 유연하고 효율적인 모델 압축 기술 개발