맞춤기술찾기

이전대상기술

사용자의 감정 또는 의도를 반영한 대화형 수어-음성 번역 장치 및 음성-수어 번역 장치

  • 기술번호 : KST2020014935
  • 담당센터 : 경기기술혁신센터
  • 전화번호 : 031-8006-1570
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명의 일실시예에 따르면, 수어 영상으로부터 수어 사용자의 감정 또는 의도를 나타내는 비언어적 수어정보를 획득하고 비언어-음성표현으로 변환하는 비언어-음성표현 변환모듈, 및 상기 수어 영상을 음성문장으로 번역하고 상기 비언어-음성표현을 반영한 대화형음성을 생성하여 출력하는 수어-음성 번역모듈을 포함하는, 사용자의 감정 또는 의도를 반영한 대화형 수어-음성 번역 장치를 제공하고, 음성으로부터 음성 언어 사용자의 감정 또는 의도를 나타내는 비언어적 음성정보를 획득하고 비언어-수어표현으로 변환하는 비언어-수어표현 변환모듈, 및 상기 음성을 수어문장으로 변환하고 상기 비언어-수어표현을 반영한 대화형수어영상을 생성하여 출력하는 음성-수어 번역모듈을 포함하는, 사용자의 감정 또는 의도를 반영한 대화형 음성-수어 번역 장치를 제공함으로써, 수어 사용자와 음성 언어 사용자의 대화시 수어와 음성 언어의 언어적인 의미전달 뿐만 아니라 의사소통 과정에서 표현되는 감정이나 의도와 같은 비언어적 의미도 전달할 수 있는 의사소통 환경을 제공할 수 있다.
Int. CL G09B 21/00 (2006.01.01) G10L 21/10 (2013.01.01) G10L 13/08 (2006.01.01)
CPC G09B 21/009(2013.01) G09B 21/009(2013.01) G09B 21/009(2013.01)
출원번호/일자 1020190095674 (2019.08.06)
출원인 한국전자기술연구원
등록번호/일자 10-2174922-0000 (2020.10.30)
공개번호/일자
공고번호/일자 (20201105) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.09.18)
심사청구항수 5

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자기술연구원 대한민국 경기도 성남시 분당구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 고상기 경기도 수원시 영통구
2 정혜동 서울특별시 송파구
3 조충상 경기도 성남시 수정구
4 박한무 경기도 성남시 분당구
5 김창조 경기도 수원시 장안구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 청운특허법인 대한민국 서울특별시 서초구 반포대로 ***, *층 (서초동, 장생빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자기술연구원 경기도 성남시 분당구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.08.06 수리 (Accepted) 1-1-2019-0806057-33
2 [심사청구]심사청구(우선심사신청)서
[Request for Examination] Request for Examination (Request for Preferential Examination)
2019.09.18 수리 (Accepted) 1-1-2019-0954114-20
3 [우선심사신청]심사청구(우선심사신청)서
[Request for Preferential Examination] Request for Examination (Request for Preferential Examination)
2019.09.20 수리 (Accepted) 1-1-2019-0965532-59
4 선행기술조사의뢰서
Request for Prior Art Search
2019.10.10 수리 (Accepted) 9-1-9999-9999999-89
5 선행기술조사보고서
Report of Prior Art Search
2019.11.08 발송처리완료 (Completion of Transmission) 9-6-2019-0127486-38
6 의견제출통지서
Notification of reason for refusal
2019.11.29 발송처리완료 (Completion of Transmission) 9-5-2019-0866245-52
7 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2020.01.22 수리 (Accepted) 1-1-2020-0077452-89
8 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.01.22 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0077453-24
9 최후의견제출통지서
Notification of reason for final refusal
2020.03.30 발송처리완료 (Completion of Transmission) 9-5-2020-0226375-69
10 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.04.29 보정승인 (Acceptance of amendment) 1-1-2020-0446431-86
11 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.04.29 수리 (Accepted) 1-1-2020-0446430-30
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.08.24 수리 (Accepted) 4-1-2020-5189497-57
13 거절결정서
Decision to Refuse a Patent
2020.08.25 발송처리완료 (Completion of Transmission) 9-5-2020-0582332-67
14 [명세서등 보정]보정서(재심사)
Amendment to Description, etc(Reexamination)
2020.09.18 보정승인 (Acceptance of amendment) 1-1-2020-0994999-49
15 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.09.18 수리 (Accepted) 1-1-2020-0994998-04
16 등록결정서
Decision to Grant Registration
2020.10.26 발송처리완료 (Completion of Transmission) 9-5-2020-0734465-07
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
수어 영상으로부터 수어 사용자의 표정, 시선, 수어 동작의 크기, 속도로 전달되는 감정 또는 의도를 나타내는 비언어적 수어정보를 획득하고, 상기 비언어적 수어정보를 음성의 속도, 음색, 어조, 크기로 전달되는 비언어-음성표현으로 변환하는 비언어-음성표현 변환모듈; 및 상기 수어 영상을 음성문장으로 번역하고, 상기 음성문장에 기초하여 대화형음성을 생성하여 출력하는 수어-음성 번역모듈을 포함하며,상기 비언어-음성표현 변환모듈은 얼굴 인식 및 모션 인식을 통하여 상기 수어 영상으로부터 수어 사용자의 감정 또는 의도를 추론하기 위한 수어 사용자의 표정, 시선, 수어 동작의 크기, 속도를 포함하는 정보를 추출하고, 추출한 정보에 기초하여 상기 수어 사용자의 감정 또는 의도의 종류를 라벨링하고 크기를 수치화하여 비언어적 수어정보를 획득하는 비언어적 수어정보 획득부; 및 상기 비언어적 수어정보를 음성 언어의 비언어적 표현에 해당하는 음성의 속도, 음색, 어조, 크기로 변환하되, 인식가능한 감정 또는 의도의 종류 및 크기를 전체 벡터공간으로 하고 상기 비언어적 수어정보에 포함된 감정 또는 의도의 종류 및 크기를 지시하도록 형성된 One-Hot Vector 형태의 특성벡터로 비언어-음성표현을 생성하는 비언어-음성표현 특징 변환부를 포함하고,상기 수어-음성 번역모듈은 수어 영상을 입력받아 수어를 글로스의 시퀀스로 출력하도록 학습된 제1 딥러닝 신경망 네트워크를 이용하여, 상기 수어 영상에 포함된 복수의 연속적인 동작들을 글로스의 시퀀스로 인식하는 글로스 인식부와, 수어의 문법에 따른 글로스의 시퀀스를 입력받아 음성 언어의 문법에 따른 음성문장으로 출력하도록 학습된 제2 딥러닝 신경망 네트워크를 이용하여, 상기 글로스 인식부가 인식한 글로스의 시퀀스로 이루어진 수어문장을 음성문장으로 번역하는 글로스-음성문장 번역부를 포함하는 수어-음성문장 번역부; 및 음성문장과 비언어-음성표현을 입력받아 대화형음성을 생성하도록 학습된 제3 딥러닝 신경망 네트워크를 이용하여, 상기 수어-음성문장 번역부에서 번역한 상기 음성문장과 상기 비언어-음성표현 특징 변환부가 생성한 상기 비언어-음성표현을 입력받아 상기 제3 딥러닝 신경망 네트워크에 입력하여, 상기 수어 사용자의 감정 또는 의도가 청각적으로 나타나도록 상기 비언어-음성표현이 반영되어 음성의 속도, 음색, 어조, 크기가 변형된 대화형음성을 생성하는 대화형음성 합성부를 포함하고,상기 글로스는 하나 또는 복수의 동작의 연속으로 이루어지는 수어의 의미단위이고,상기 글로스의 시퀀스는 복수의 글로스가 수어 문법에 따라 순서대로 나열되는 것이며,상기 제1 딥러닝 신경망 네트워크는 순환 신경망 구조로 이루어진 인코더와 순환 신경망 구조로 이루어진 디코더를 포함하는 시퀀스 투 시퀀스 구조를 갖고, 입력이 수어 영상에서 수어 사용자의 신체의 특징점들을 추출하고 시간의 흐름에 따라 변화하는 특징점들의 좌표값을 순서대로 나열한 데이터이고 정답이 글로스의 시퀀스인 학습데이터를 이용하여 학습되는 것이고, 상기 제2 딥러닝 신경망 네트워크는 순환 신경망 구조로 이루어진 인코더와 순환 신경망 구조로 이루어진 디코더를 포함하는 시퀀스 투 시퀀스 구조를 갖고, 입력이 글로스의 시퀀스이고 정답이 단어의 시퀀스로 이루어진 음성문장인 학습데이터를 이용하여 학습되는 것인, 사용자의 감정 또는 의도를 반영한 대화형 수어-음성 번역 장치
2 2
삭제
3 3
삭제
4 4
삭제
5 5
삭제
6 6
청구항 1에 있어서, 상기 대화형음성 합성부는 목소리의 성별을 포함하는 사용자 설정 취향을 상기 대화형음성에 더 반영하는, 사용자의 감정 또는 의도를 반영한 대화형 수어-음성 번역 장치
7 7
음성으로부터 음성 언어 사용자의 음성의 속도, 음색, 어조, 크기로 전달되는 감정 또는 의도를 나타내는 비언어적 음성정보를 획득하고, 상기 비언어적 음성정보를 표정, 시선, 수어 동작의 크기, 속도로 전달되는 비언어-수어표현으로 변환하는 비언어-수어표현 변환모듈; 및 상기 음성을 수어문장으로 변환하고, 상기 수어문장에 기초하여 대화형수어영상을 생성하여 출력하는 음성-수어 번역모듈을 포함하며, 상기 비언어-수어표현 변환모듈은 상기 음성으로부터 음성 언어 사용자의 감정 또는 의도를 추론하기 위한 음성의 속도, 음색, 어조, 크기를 포함하는 사운드-기반 비언어 정보를 추출하고, 상기 음성 이외에 음성 언어 사용자를 촬영한 영상으로부터 음성 언어 사용자의 감정 또는 의도를 추론하기 위한 표정, 시선을 포함하는 영상-기반 비언어 정보를 추출하고, 추출한 사운드-기반 비언어 정보와 영상-기반 비언어 정보에 기초하여 상기 음성 언어 사용자의 감정 또는 의도의 종류를 라벨링하고 크기를 수치화하여 비언어적 음성정보를 획득하는 비언어적 음성정보 획득부; 및 상기 비언어적 음성정보를 수어의 비언어적 표현에 해당하는 표정, 시선, 수어 동작의 크기, 속도로 변환하되, 인식가능한 감정 또는 의도의 종류 및 크기를 전체 벡터공간으로 하고 상기 비언어적 음성정보에 포함된 감정 또는 의도의 종류 및 크기를 지시하도록 형성된 One-Hot Vector 형태의 특성벡터로 비언어-수어표현을 생성하는 비언어-수어표현 특징 변환부를 포함하고,상기 음성-수어 번역모듈은 음성을 입력받아 음성 문장을 생성하도록 학습된 제4 딥러닝 신경망 네트워크를 이용하여, 음성을 음성문장으로 STT 변환하는 음성문장 인식부; 및 입력이 음성문장이고 정답이 글로스의 시퀀스로 이루어진 학습데이터로 학습된 제5 딥러닝 신경망 네트워크를 이용하여, 상기 음성문장을 입력받아 수어의 의미단위인 글로스의 시퀀스로 이루어진 수어문장으로 번역하는 음성문장-글로스 번역부와, 상기 수어문장에 상기 비언어-수어표현을 반영하여 상기 음성 언어 사용자의 감정 또는 의도가 시각적으로 나타나도록 표정, 시선, 수어 동작의 크기, 속도가 변형된 대화형수어영상을 합성하여 출력하는 대화형수어영상 합성부를 포함하는 음성문장-수어 번역부를 포함하고,상기 글로스는 하나 또는 복수의 동작의 연속으로 이루어지는 수어의 의미단위이고,상기 글로스의 시퀀스는 복수의 글로스가 수어 문법에 따라 순서대로 나열되는 것이고,상기 제4 딥러닝 신경망 네트워크는 시퀀스 투 시퀀스 기반으로, 입력이 음성이고 정답이 음성 언어 단어의 시퀀스로 이루어진 음성문장인 학습데이터로 학습되는 것인, 사용자의 감정 또는 의도를 반영한 대화형 음성-수어 번역 장치
8 8
삭제
9 9
삭제
10 10
삭제
11 11
삭제
12 12
삭제
13 13
청구항 7에 있어서,상기 대화형수어영상 합성부는 생성 모델(Generative model)에 기반하여 상기 글로스에 해당하는 미리 저장된 동작들을 상기 글로스의 시퀀스에 따라 연결하여 대화형수어영상을 합성하되, 상기 비언어-수어표현을 반영하여 표정, 시선, 수어 동작의 크기, 속도가 변형된 대화형수어영상을 합성하여 출력하는 것인, 사용자의 감정 또는 의도를 반영한 대화형 음성-수어 번역 장치
14 14
청구항 13에 있어서,상기 대화형수어영상 합성부는 사용자 설정 취향을 상기 대화형수어영상에 더 반영하는, 사용자의 감정 또는 의도를 반영한 대화형 음성-수어 번역 장치
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 전자부품연구원 정보통신·방송 연구개발 사업 자율지능 디지털 동반자 프레임워크 및 응용 연구개발