맞춤기술찾기

이전대상기술

멀티모달 다중 화자 대화 속 인물 식별 방법 및 장치

  • 기술번호 : KST2020006647
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 일 실시예에 따른 멀티모달 다중 화자 대화 속 인물 식별 방법은, 다중 화자 대화에서, 대본 정보의 멘션 및 상기 대본 정보 상에서 상기 멘션을 포함하는 문장이 발화되는 시점의 영상 정보를 분석함에 따라 각각의 표현 정보를 획득하는 단계; 및 상기 획득된 각각의 표현 정보에 기초하여 상기 다중 화자 대화에서의 멘션이 의미하는 인물을 식별하는 단계를 포함할 수 있다.
Int. CL G06K 9/62 (2006.01.01) H04N 21/44 (2011.01.01) G06K 9/48 (2006.01.01)
CPC
출원번호/일자 1020190054140 (2019.05.09)
출원인 한국과학기술원
등록번호/일자
공개번호/일자 10-2020-0066134 (2020.06.09) 문서열기
공고번호/일자
국제출원번호/일자
국제공개번호/일자
우선권정보 대한민국  |   1020180152107   |   2018.11.30
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2019.05.09)
심사청구항수 7

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국과학기술원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최기선 대전광역시 유성구
2 한기종 대전광역시 유성구
3 신기연 대전광역시 유성구
4 김동환 대전광역시 유성구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 양성보 대한민국 서울특별시 강남구 선릉로***길 ** (논현동) 삼성빌딩 *층(피앤티특허법률사무소)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
최종권리자 정보가 없습니다
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2019.05.09 수리 (Accepted) 1-1-2019-0472811-63
2 [출원서 등 보정]보정서
[Amendment to Patent Application, etc.] Amendment
2019.09.03 수리 (Accepted) 1-1-2019-0908025-42
3 선행기술조사의뢰서
Request for Prior Art Search
2019.11.12 수리 (Accepted) 9-1-9999-9999999-89
4 선행기술조사보고서
Report of Prior Art Search
2019.12.09 수리 (Accepted) 9-1-2019-0055471-71
5 의견제출통지서
Notification of reason for refusal
2020.04.21 발송처리완료 (Completion of Transmission) 9-5-2020-0280169-15
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.05.15 수리 (Accepted) 4-1-2020-5108396-12
7 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2020.06.11 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2020-0600834-41
8 [거절이유 등 통지에 따른 의견]의견서·답변서·소명서
2020.06.11 수리 (Accepted) 1-1-2020-0600833-06
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.06.12 수리 (Accepted) 4-1-2020-5131486-63
10 등록결정서
Decision to grant
2020.10.07 발송처리완료 (Completion of Transmission) 9-5-2020-0690656-00
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
멀티모달 다중 화자 대화 속 인물 식별 방법에 있어서, 다중 화자 대화에서, 대본 정보의 멘션 및 상기 대본 정보 상에서 상기 멘션을 포함하는 문장이 발화되는 시점의 영상 정보를 분석함에 따라 각각의 표현 정보를 획득하는 단계; 및 상기 획득된 각각의 표현 정보에 기초하여 상기 다중 화자 대화에서의 멘션이 의미하는 인물을 식별하는 단계를 포함하는 인물 식별 방법
2 2
제1항에 있어서, 상기 대본 정보의 텍스트 데이터와 상기 대본 정보 상에서 상기 멘션을 포함하는 문장이 발화되는 시점에 해당하는 영상 정보를 정렬함에 따라 상기 대본 정보와 상기 영상 정보를 결합하여 인물을 식별하기 위한 데이터를 전처리하는 단계를 더 포함하는 인물 식별 방법
3 3
제2항에 있어서, 상기 전처리하는 단계는, 상기 대본 정보의 텍스트 데이터에 시간 정보를 부착하기 위하여 자막 데이터와 동기화하는 단계를 포함하는 인물 식별 방법
4 4
제3항에 있어서, 상기 전처리하는 단계는, 상기 자막 데이터의 대사 하나와 상기 텍스트 데이터의 대사 하나를 기본 단위로 하여, 각 대본 정보의 대사에 대하여 토큰 유사도가 기 설정된 기준 값 이상인 후보군을 추출하고, 상기 추출된 후보군을 최장 증가 수열 알고리즘에 기초하여 각 대본 정보의 대사에 0 또는 1개의 자막 데이터를 매칭하여 상기 텍스트 데이터에 시간 정보를 부착하는 단계를 포함하는 인물 식별 방법
5 5
제2항에 있어서, 상기 전처리하는 단계는, 상기 멘션을 포함하는 문장이 발화되는 시점에 해당하는 영상 정보의 구간을 초당 기 설정된 개수의 이미지를 가지는 각 장면 이미지로 분할하고, 상기 분할된 각 장면 이미지에 대하여 미리 학습된 네트워크를 통과시켜 기 설정된 크기의 장면의 벡터값을 추출하는 단계를 포함하는 인물 식별 방법
6 6
제1항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 상기 대본 정보의 문맥 흐름과 화자 정보를 반영하여 대본 정보 내의 각 멘션의 특징을 나타내는 벡터 표현을 생성하고, 상기 멘션이 발화되는 시간에 따라 영상 정보의 특징을 나타내는 벡터 표현을 생성하는 단계를 포함하는 인물 식별 방법
7 7
제1항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 상기 다중 화자 대화에서, 미리 정의된 등장 인물을 대상으로 멘션이 나타내는 인물을 분류하는 단계를 포함하는 인물 식별 방법
8 8
제7항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 멘션의 단어를 제1 벡터로 표현하고, 상기 멘션의 발화자를 랜덤하게 제2 벡터로 표현한 뒤, 상기 제1 벡터 및 상기 제2 벡터를 이용하여 Bi-LSTM을 통과시킴에 따라 제3 벡터(hi)를 획득하고, 영상 정보에 대하여 ResNet-152를 통과한 제1 영상 정보 벡터를 ReLu 활성함수를 가진 리니어 레이어(Linear Layer)에 통과시킴에 따라 제2 영상 정보 벡터(vi)를 획득하는 단계를 포함하는 인물 식별 방법
9 9
제8항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 상기 획득된 제2 영상 정보 벡터(vi)를 상기 획득된 제3 벡터(hi)와 결합시켜 인물을 식별하고자 하는 멘션을 표현하는 벡터(ei)와 각 인물의 특징을 표현하는 개체 라이브러리(Entity Library) 행렬에 대한 벡터와 코사인 유사도(Cosine Similarity)를 계산하고, 상기 계산된 값을 소프트맥스(Softmax) 레이어를 통과시켜 상기 멘션이 나타내는 인물을 분류하는 단계를 포함하는 인물 식별 방법
10 10
제1항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 상기 다중 화자 대화에서, 미리 정의된 인물의 정보없이 상호참조 해결에 기초하여 멘션이 나타내는 인물을 분류하는 단계를 포함하는 인물 식별 방법
11 11
제10항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 멘션의 단어를 임베딩과 Bi-LSTM 레이어를 통해 표현하고, 각 멘션이 복수 개의 단어로 이루어져 있는 경우, 어텐션으로 학습시키고, 어텐션 레이어를 통과한 멘션 표현 벡터(gi)를 생성하고, 상기 멘션이 발화된 시점의 ResNet을 통과한 영상정보 벡터를 제1 완전 연결 레이어(Fully Connected Layer)에 통과시킨 벡터(vi)를 생성하고, 상기 생성된 벡터(vi)를 선행사 점수를 계산하는 제2 완전 연결 레이어에 입력하는 단계를 포함하는 인물 식별 방법
12 12
제11항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 복수 개의 멘션 표현 벡터간의 상호참조 여부를 판단하기 위하여 각 멘션이 발화된 시점의 영상 정보를 반영하여 선행사 점수를 계산하고, 상기 계산된 선행사 점수에 기초하여 멘션 후보를 선정하는 단계를 포함하는 인물 식별 방법
13 13
제12항에 있어서, 상기 각각의 표현 정보를 획득하는 단계는, 상기 선정된 멘션 후보에 기초하여 동일한 대상을 나타내는 멘션들끼리 그룹을 생성하고, 상기 생성된 그룹 내의 각 멘션들을 기 설정된 우선 순위에 기초하여 실제 인물과 매칭하는 단계를 포함하는 인물 식별 방법
14 14
제1항에 있어서, 상기 획득된 각각의 표현 정보에 기초하여 상기 다중 화자 대화에서의 멘션이 의미하는 인물을 식별하는 단계는,상기 다중 화자 대화에서의 각 멘션이 지칭하는 인물을 식별한 식별 결과를 출력하는 단계를 포함하는 인물 식별 방법
15 15
멀티모달 다중 화자 대화 속 인물 식별 시스템에 있어서, 다중 화자 대화에서, 대본 정보의 멘션 및 상기 대본 정보 상에서 상기 멘션을 포함하는 문장이 발화되는 시점의 영상 정보를 분석함에 따라 각각의 표현 정보를 획득하는 획득부; 상기 획득된 각각의 표현 정보에 기초하여 상기 다중 화자 대화에서의 멘션이 의미하는 인물을 식별하는 식별부; 및 상기 대본 정보의 텍스트 데이터와 상기 대본 정보 상에서 상기 멘션이 발화되는 시점에 해당하는 영상 정보를 정렬하여 상기 대본 정보와 상기 영상 정보를 결합하여 인물을 식별하기 위한 데이터를 전처리하는 전처리부를 포함하는 인물 식별 시스템
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 과학기술정보통신부 한국과학기술원 정보통신.방송 연구개발사업 (EZBARO)(세부2) 비디오 이해를 위한 이벤트-상황 지식체계 학습 및 이벤트인식/관계추론 기술 개발(2019)