맞춤기술찾기

이전대상기술

언어 모델 압축을 위한 언어 컨텍스트 지식 증류의 방법 및 그를 수행하는 컴퓨터 시스템

  • 기술번호 : KST2023008110
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 개시는 언어 모델 압축을 위한 언어 컨텍스트 지식 증류의 방법 및 그를 수행하는 컴퓨터 시스템에 관한 것으로, 대규모 네트워크를 통해, 문장을 학습하고, 대규모 네트워크와 지식 연결되는 복수의 소규모 네트워크들을 통해, 대규모 네트워크로부터 전달되는 정보에 기반하여 학습하도록 구성되며, 정보는 대규모 네트워크로부터 출력되는 단어 임베딩 벡터들의 분포를 기반으로 정의되는 컨텍스트 지식을 포함할 수 있다.
Int. CL G06N 20/20 (2019.01.01) G06N 3/04 (2023.01.01) G06N 3/08 (2023.01.01)
CPC G06N 20/20(2013.01) G06N 3/045(2013.01) G06N 3/088(2013.01)
출원번호/일자 1020220032048 (2022.03.15)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2023-0134809 (2023.09.22) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2022.03.15)
심사청구항수 20

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 양은호 대전광역시 유성구
2 박건도 대전광역시 유성구
3 김경만 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2022.03.15 수리 (Accepted) 1-1-2022-0278224-69
2 특허고객번호 정보변경(경정)신고서·정정신고서
2023.01.31 수리 (Accepted) 4-1-2023-5023571-05
3 특허고객번호 정보변경(경정)신고서·정정신고서
2023.05.04 수리 (Accepted) 4-1-2023-5110236-33
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
인공 신경망 모델에 지식 증류를 적용하는 컴퓨터 시스템의 방법에 있어서, 대규모 네트워크를 통해, 문장을 학습하는 단계; 및상기 대규모 네트워크와 지식 연결되는 복수의 소규모 네트워크들을 통해, 상기 대규모 네트워크로부터 전달되는 정보에 기반하여 학습하는 단계를 포함하고, 상기 정보는,상기 대규모 네트워크로부터 출력되는 단어 임베딩 벡터들의 분포를 기반으로 정의되는 컨텍스트 지식을 포함하는,컴퓨터 시스템의 방법
2 2
제 1 항에 있어서, 상기 컨텍스트 지식은, 상기 단어 임베딩 벡터들 사이의 거리 및 각도를 기반으로 결정되는, 컴퓨터 시스템의 방법
3 3
제 1 항에 있어서, 상기 단어 임베딩 벡터들은,복수의 계층들로 분포되고, 상기 계층들의 각각에는, 상이한 단어들에 대한 단어 임베딩 벡터들이 배치되고, 상기 계층들에 걸쳐, 동일한 단어에 대한 단어 임베딩 벡터들이 배치되는,컴퓨터 시스템의 방법
4 4
제 3 항에 있어서, 상기 컨텍스트 지식은,상기 계층들의 각각에서의 상기 상이한 단어들에 대한 단어 임베딩 벡터들 사이의 단어 관계를 포함하는,컴퓨터 시스템의 방법
5 5
제 4 항에 있어서, 상기 계층들의 각각의 상기 상이한 단어들에 대한 단어 임베딩 벡터들 사이에서 페어들과 트리플들이 결정되고, 상기 단어 관계는,상기 페어들을 각각 구성하는 단어 임베딩 벡터들 사이의 거리들로 정의되는 페어-와이즈 관계와 상기 트리플들을 각각 구성하는 단어 임베딩 벡터들 사이의 각도들로 정의되는 트리플-와이즈 관계의 합으로 정의되는,컴퓨터 시스템의 방법
6 6
제 3 항에 있어서, 상기 컨텍스트 지식은,상기 계층들에 걸친 상기 동일한 단어에 대한 단어 임베딩 벡터들 사이의 계층 변환 관계를 포함하는,컴퓨터 시스템의 방법
7 7
제 6 항에 있어서, 상기 계층들에 걸쳐 상기 동일한 단어에 대한 단어 임베딩 벡터들 사이에서 페어들과 트리플들이 결정되고, 상기 계층 변환 관계는,상기 페어들을 각각 구성하는 단어 임베딩 벡터들 사이의 거리들로 정의되는 페어-와이즈 관계와 상기 트리플들을 각각 구성하는 단어 임베딩 벡터들 사이의 각도들로 정의되는 트리플-와이즈 관계의 합으로 정의되는,컴퓨터 시스템의 방법
8 8
제 3 항에 있어서, 상기 단어 임베딩 벡터들의 상기 계층들의 수는,상기 대규모 네트워크에서의 계층들의 수로 결정되고,상기 컨텍스트 지식은,상기 대규모 네트워크에서의 계층들의 수와 상기 소규모 네트워크들의 각각에서의 계층들의 수가 상이하면, 상기 단어 임베딩 벡터들의 상기 계층들의 수를 상기 소규모 네트워크들의 각각에서의 계층들의 수와 일치시키는,컴퓨터 시스템의 방법
9 9
제 5 항 또는 제 7 항에 있어서, 상기 페어-와이즈 관계 및 상기 트리플-와이즈 관계는,상기 대규모 네트워크와 상기 소규모 네트워크들 사이에서 일치되는,컴퓨터 시스템의 방법
10 10
인공 신경망 모델에 지식 증류를 적용하는 컴퓨터 시스템에 있어서,메모리; 및상기 메모리와 연결되고, 상기 메모리에 저장된 적어도 하나의 명령을 실행하도록 구성되는 프로세서를 포함하고, 상기 프로세서는,문장을 학습하는 대규모 네트워크, 및 상기 대규모 네트워크와 지식 연결되고, 상기 대규모 네트워크로부터 전달되는 정보에 기반하여 학습하는 복수의 소규모 네트워크들을 포함하는 인공 신경망 모델을 포함하고, 상기 정보는, 상기 대규모 네트워크로부터 출력되는 단어 임베딩 벡터들의 분포를 기반으로 정의되는 컨텍스트 지식을 포함하는,컴퓨터 시스템
11 11
제 10 항에 있어서, 상기 프로세서는,상기 단어 임베딩 벡터들 사이의 거리 및 각도를 기반으로, 상기 컨텍스트 지식을 결정하도록 구성되는, 컴퓨터 시스템
12 12
제 10 항에 있어서, 상기 단어 임베딩 벡터들은,복수의 계층들로 분포되고, 상기 계층들의 각각에는, 상이한 단어들에 대한 단어 임베딩 벡터들이 배치되고, 상기 계층들에 걸쳐, 동일한 단어에 대한 단어 임베딩 벡터들이 배치되는,컴퓨터 시스템
13 13
제 12 항에 있어서, 상기 컨텍스트 지식은,상기 계층들의 각각에서의 상기 상이한 단어들에 대한 단어 임베딩 벡터들 사이의 단어 관계를 포함하는,컴퓨터 시스템
14 14
제 13 항에 있어서, 상기 프로세서는,상기 계층들의 각각의 상기 상이한 단어들에 대한 단어 임베딩 벡터들 사이에서 페어들과 트리플들을 결정하고, 상기 페어들을 각각 구성하는 단어 임베딩 벡터들 사이의 거리들로 정의되는 페어-와이즈 관계와 상기 트리플들을 각각 구성하는 단어 임베딩 벡터들 사이의 각도들로 정의되는 트리플-와이즈 관계의 합으로, 상기 단어 관계를 결정하도록 구성되는,컴퓨터 시스템
15 15
제 12 항에 있어서, 상기 컨텍스트 지식은,상기 계층들에 걸친 상기 동일한 단어에 대한 단어 임베딩 벡터들 사이의 계층 변환 관계를 포함하는,컴퓨터 시스템
16 16
제 15 항에 있어서, 상기 프로세서는,상기 계층들에 걸쳐 상기 동일한 단어에 대한 단어 임베딩 벡터들 사이에서 페어들과 트리플들을 결정하고, 상기 페어들을 각각 구성하는 단어 임베딩 벡터들 사이의 거리들로 정의되는 페어-와이즈 관계와 상기 트리플들을 각각 구성하는 단어 임베딩 벡터들 사이의 각도들로 정의되는 트리플-와이즈 관계의 합으로, 상기 계층 변환 관계를 결정하도록 구성되는,컴퓨터 시스템
17 17
제 12 항에 있어서, 상기 단어 임베딩 벡터들의 상기 계층들의 수는,상기 대규모 네트워크에서의 계층들의 수로 결정되고,상기 컨텍스트 지식은,상기 대규모 네트워크에서의 계층들의 수와 상기 소규모 네트워크들의 각각에서의 계층들의 수가 상이하면, 상기 단어 임베딩 벡터들의 상기 계층들의 수를 상기 소규모 네트워크들의 각각에서의 계층들의 수와 일치시키는,컴퓨터 시스템
18 18
제 14 항 또는 제 16 항에 있어서,상기 페어-와이즈 관계 및 상기 트리플-와이즈 관계는,상기 대규모 네트워크와 상기 소규모 네트워크들 사이에서 일치되는,컴퓨터 시스템
19 19
인공 신경망 모델에 지식 증류를 적용하는 방법을 컴퓨터 시스템에 실행시키기 위한 하나 이상의 프로그램을 저장하는 비-일시적인 컴퓨터 판독 가능한 기록 매체에 있어서,상기 방법은,대규모 네트워크를 통해, 문장을 학습하는 단계; 및상기 대규모 네트워크와 지식 연결되는 복수의 소규모 네트워크들을 통해, 상기 대규모 네트워크로부터 전달되는 정보에 기반하여 학습하는 단계를 포함하고, 상기 정보는,상기 대규모 네트워크로부터 출력되는 단어 임베딩 벡터들의 분포를 기반으로 정의되는 컨텍스트 지식을 포함하는,비-일시적인 컴퓨터 판독 가능한 기록 매체
20 20
제 19 항에 있어서,상기 컨텍스트 지식은, 상기 단어 임베딩 벡터들 사이의 거리 및 각도를 기반으로 결정되는, 비-일시적인 컴퓨터 판독 가능한 기록 매체
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 연구개발사업 (N01210200)(통합EZ)뇌·인지 발달과정의 기초-영아단계 모사형 실세계 상호작용 경험 기반 객체 관련 개념의 기계학습 기술 개발(2021년도)