맞춤기술찾기

이전대상기술

대용량 사전 학습 모델을 사용한 엔드 투 엔드 파이프라인 대화 시스템

  • 기술번호 : KST2022006191
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 대용량 사전 학습 모델을 사용한 엔드 투 엔드 파이프라인 대화 시스템 및 그 동작 방법이 제시된다. 본 발명에서 제안하는 대용량 사전 학습 모델을 사용한 엔드 투 엔드 파이프라인 대화 시스템은 대화 이력에 따라 조건화된 최근 도메인과 해당 대화 상태를 예측하는 대화 상태 예측부, 대화 이력과 대화 상태를 조건으로 하는 탈어휘화 토큰(delexicalized tokens)으로 시스템 동작을 예측하는 시스템 동작 예측부, 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리를 반환하는 쿼리 검색부 및 대화 이력, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하고, 생성된 시스템 응답의 탈어휘화 토큰을 쿼리 결과로 업데이트하는 시스템 응답 생성부를 포함한다.
Int. CL G06N 3/08 (2006.01.01) G06N 3/04 (2006.01.01) G06F 16/332 (2019.01.01)
CPC
출원번호/일자 1020210036436 (2021.03.22)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2022-0069781 (2022.05.27) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020200156340   |   2020.11.20
법적상태 공개
심사진행상태 수리
심판사항
구분 국내출원/신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2021.03.22)
심사청구항수 15

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김기응 대전광역시 유성구
2 함동훈 대전광역시 유성구
3 이정관 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2021.03.22 수리 (Accepted) 1-1-2021-0330994-61
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
대화 이력에 따라 조건화된 최근 도메인과 해당 대화 상태를 예측하는 대화 상태 예측부; 대화 이력과 대화 상태를 조건으로 하는 탈어휘화 토큰(delexicalized tokens)으로 시스템 동작을 예측하는 시스템 동작 예측부; 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리를 반환하는 쿼리 검색부; 및 대화 이력, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하고, 생성된 시스템 응답의 탈어휘화 토큰을 쿼리 결과로 업데이트하는 시스템 응답 생성부를 포함하는 엔드 투 엔드 파이프라인 대화 시스템
2 2
제1항에 있어서, 시스템 동작 예측부는, 대화 상황에 따른 정보를 제공하기 위해 참조 번호, 이름, 우편 번호, 전화 번호, 주소를 포함하는 요청 가능한 슬롯에 대한 모든 값을 코퍼스에 나타나는 도메인 및 슬롯 네임으로 탈어휘화를 수행하는 엔드 투 엔드 파이프라인 대화 시스템
3 3
제2항에 있어서, 시스템 동작 예측부는, MultiWOZ 데이터셋의 탈어휘화 버전에 적용된 미리 훈련된 GPT-2 모델을 사용하여 대화 관리 파이프라인을 따르도록 미세 조정(finetuned)을 수행하는 엔드 투 엔드 파이프라인 대화 시스템
4 4
제3항에 있어서, 미리 훈련된 GPT-2 모델을 사용하여 대화 관리 파이프라인을 따르도록 미세 조정(finetuned)을 수행하기 위해 언어 모델링 및 차세대 발화 분류의 가중치 합계를 최적화하고, 언어 모델링을 통해 이전 단어 토큰으로부터 다음 단어 토큰의 우도(likelihood)를 계산하고, 차세대 발화 분류를 통해 대화 이력이 주어지는 디스트랙터(distractor)로부터 골드 응답(gold response)을 분류하는 엔드 투 엔드 파이프라인 대화 시스템
5 5
제1항에 있어서, 쿼리 검색부는, 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리가 없는 경우 빈 쿼리 결과에 해당하는 시스템 응답을 생성하도록 하고, 현재 시스템 동작을 업데이트하는 엔드 투 엔드 파이프라인 대화 시스템
6 6
제1항에 있어서, 시스템 응답 생성부는, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하기 위해 미리 훈련된 GPT-2 모델을 통해 학습하고, 이후 탈어휘화 토큰을 후처리 코드를 사용하는 데이터베이스 쿼리의 실제 정보로 대체하는 엔드 투 엔드 파이프라인 대화 시스템
7 7
제6항에 있어서, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성할 때 최종 출력은 각 위치에서 단어 토큰의 확률 분포이고, 상기 단어 토큰의 확률 분포를 사용하여 단어 토큰을 생성하는 디코딩을 수행하며, 디코딩을 통해 모델의 성능을 평가하고 인적 평가를 통해 최적의 모델을 선택하는 엔드 투 엔드 파이프라인 대화 시스템
8 8
대화 상태 예측부를 통해 대화 이력에 따라 조건화된 최근 도메인과 해당 대화 상태를 예측하는 단계; 시스템 동작 예측부가 대화 이력과 대화 상태를 조건으로 하는 탈어휘화 토큰(delexicalized tokens)으로 시스템 동작을 예측하는 단계; 쿼리 검색부가 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리를 반환하는 단계; 시스템 응답 생성부가 대화 이력, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하는 단계; 및 시스템 응답 생성부가 생성된 시스템 응답의 탈어휘화 토큰을 쿼리 결과로 업데이트하는 단계를 포함하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
9 9
제8항에 있어서,대화 상태 예측부를 통해 대화 이력과 대화 상태를 조건으로 하는 탈어휘화 토큰으로 시스템 동작을 예측하는 단계는, 대화 상황에 따른 정보를 제공하기 위해 참조 번호, 이름, 우편 번호, 전화 번호, 주소를 포함하는 요청 가능한 슬롯에 대한 모든 값을 코퍼스에 나타나는 도메인 및 슬롯 네임으로 탈어휘화를 수행하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
10 10
제9항에 있어서, MultiWOZ 데이터셋의 탈어휘화 버전에 적용된 미리 훈련된 GPT-2 모델을 사용하여 대화 관리 파이프라인을 따르도록 미세 조정(finetuned)을 수행하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
11 11
제10항에 있어서, 미리 훈련된 GPT-2 모델을 사용하여 대화 관리 파이프라인을 따르도록 미세 조정(finetuned)을 수행하기 위해 언어 모델링 및 차세대 발화 분류의 가중치 합계를 최적화하고, 언어 모델링을 통해 이전 단어 토큰으로부터 다음 단어 토큰의 우도(likelihood)를 계산하고, 차세대 발화 분류를 통해 대화 이력이 주어지는 디스트랙터(distractor)로부터 골드 응답(gold response)을 분류하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
12 12
제8항에 있어서, 쿼리 검색부가 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리를 반환하는 단계는, 시스템 동작에 데이터베이스로부터의 외부 정보가 필요한 경우 쿼리 모듈을 통해 후보들을 검색하고, 후보들 중 제약 조건을 만족하는 쿼리가 없는 경우 빈 쿼리 결과에 해당하는 시스템 응답을 생성하도록 하고, 현재 시스템 동작을 업데이트하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
13 13
제8항에 있어서, 시스템 응답 생성부가 대화 이력, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하는 단계는, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성하기 위해 미리 훈련된 GPT-2 모델을 통해 학습하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
14 14
제13항에 있어서, 시스템 응답 생성부가 생성된 시스템 응답의 탈어휘화 토큰을 쿼리 결과로 업데이트하는 단계는, 생성된 시스템 응답의 탈어휘화 토큰을 후처리 코드를 사용하는 데이터베이스 쿼리의 실제 정보로 대체하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
15 15
제13항에 있어서, 대화 상태 및 시스템 동작에 따라 탈어휘화 토큰을 사용하여 시스템 응답을 생성할 때 최종 출력은 각 위치에서 단어 토큰의 확률 분포이고, 상기 단어 토큰의 확률 분포를 사용하여 단어 토큰을 생성하는 디코딩을 수행하며, 디코딩을 통해 모델의 성능을 평가하고 인적 평가를 통해 최적의 모델을 선택하는 엔드 투 엔드 파이프라인 대화 시스템의 동작 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 연구개발사업 (통합EZ)의사결정 이유를 설명할 수 있는 인간 수준의 학습·추론 프레임워크 개발(2020)