맞춤기술찾기

이전대상기술

영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템

  • 기술번호 : KST2021005456
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법 및 인터페이스 시스템이 제시된다. 본 발명에서 제안하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법은 입력 영상으로부터 립 랜드마크(lip landmark)를 감지하고, 감지된 립 랜드마크의 영상 발화 시점/종점 및 음성 발화 시점/종점을 설정하는 단계 및 설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 단계를 포함한다.
Int. CL G06N 3/08 (2006.01.01) G06N 20/20 (2019.01.01) G10L 15/25 (2013.01.01)
CPC
출원번호/일자 1020200033801 (2020.03.19)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2021-0054961 (2021.05.14) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020190140684   |   2019.11.06
법적상태 공개
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2020.03.19)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 양현승 대전광역시 유성구
2 김경영 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2020.03.19 수리 (Accepted) 1-1-2020-0290863-26
2 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
4 선행기술조사의뢰서
Request for Prior Art Search
2021.03.19 수리 (Accepted) 9-1-9999-9999999-89
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
입력 영상으로부터 립 랜드마크(lip landmark)를 감지하고, 감지된 립 랜드마크의 영상 발화 시점/종점 및 음성 발화 시점/종점을 설정하는 단계; 및 설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 단계를 포함하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
2 2
제1항에 있어서,입력 영상으로부터 립 랜드마크를 감지하고, 감지된 립 랜드마크의 영상 발화 시점/종점 및 음성 발화 시점/종점을 설정하는 단계는, 립 랜드마크의 영상 발화 시점/종점을 설정하기 위해 광 흐름(Optical Flow), 입술 사이 거리 및 입술 내부 면적을 분석하여 단위 프레임 내 분산을 구하고, 발화 절정 구간을 설정하여 영상 발화 시점/종점 구간 및 신뢰도를 설정하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
3 3
제1항에 있어서,입력 영상으로부터 립 랜드마크를 감지하고, 감지된 립 랜드마크의 영상 발화 시점/종점 및 음성 발화 시점/종점을 설정하는 단계는, 음성 발화 시점/종점을 설정하기 위해 서브 샘플링(Sub Sampling), 잡음제어(Denoising) 및 프리엠퍼시스(Pre Emphasis)를 수행하여 음성 발화 시점/종점 구간 및 신뢰도를 설정하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
4 4
제1항에 있어서,설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 단계는, 멀티플 타워 네트워크(multiple tower network)에 배치 정규화(batch normalization) 기술을 추가로 적용하여 분류하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
5 5
제1항에 있어서,설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 단계는, 프레임 단위의 데이터 증강을 위해 복수의 형태의 프레임들에 초점을 둔 데이터 증강 작업을 추가로 수행하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
6 6
제1항에 있어서,설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 단계는, 프레임 설정 환경에 따라 각 입력 영상에 대해 병렬적으로 분류를 수행하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 방법
7 7
입력 영상으로부터 립 랜드마크(lip landmark)를 감지하고, 감지된 립 랜드마크의 영상 발화 시점/종점 및 음성 발화 시점/종점을 설정하는 전처리부; 및 설정된 음성 발화 시점/종점 및 영상 발화 시점/종점을 딥러닝 모델에 기초하여 단어를 분류하는 분류부를 포함하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
8 8
제7항에 있어서, 전처리부는, 립 랜드마크의 영상 발화 시점/종점을 설정하기 위해 광 흐름(Optical Flow), 입술 사이 거리 및 입술 내부 면적을 분석하여 단위 프레임 내 분산을 구하고, 발화 절정 구간을 설정하여 영상 발화 시점/종점 구간 및 신뢰도를 설정하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
9 9
제7항에 있어서, 전처리부는, 음성 발화 시점/종점을 설정하기 위해 서브 샘플링(Sub Sampling), 잡음제어(Denoising) 및 프리엠퍼시스(Pre Emphasis)를 수행하여 음성 발화 시점/종점 구간 및 신뢰도를 설정하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
10 10
제7항에 있어서, 분류부는, 멀티플 타워 네트워크(multiple tower network)에 배치 정규화(batch normalization) 기술을 추가로 적용하여 분류하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
11 11
제7항에 있어서, 분류부는, 프레임 단위의 데이터 증강을 위해 복수의 형태의 프레임들에 초점을 둔 데이터 증강 작업을 추가로 수행하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
12 12
제7항에 있어서, 분류부는, 프레임 설정 환경에 따라 각 입력 영상에 대해 병렬적으로 분류를 수행하는 영상을 활용한 딥러닝 모델 기반의 실시간 립리딩 인터페이스 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국전자통신연구원 정보통신.방송 연구개발사업 (EZBARO)고령 사회에 대응하기 위한 실환경 휴먼케어 로봇 기술 개발(2019)