맞춤기술찾기

이전대상기술

오디오/영상물의 음향적 장면분할방법

  • 기술번호 : KST2015101339
  • 담당센터 : 대전기술혁신센터
  • 전화번호 : 042-610-2279
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 본 발명은 오디오자료나 영상물을 구성하는 주요 대상물의 소리를 이용하여 장면을 분할하는 오디오/영상물의 음향적 장면분할방법에 관한 것이다. 이러한 음향적 장면분할방법은, 음향적 장면으로 분할하고자 하는 오디오자료 혹은 영상물에 등장하는 대상물(사람, 동물, 악기, 음향기기 등을 모두 지칭)이 내는 소리(대상물이 내는 모든 소리를 지칭)별로 소리모델을 생성하여 저장하는 제1단계와, 상기 오디오자료 혹은 영상물로부터 제공되는 임의의 소리의 시작부터 종료까지의 분할구간에서 상기 임의의 소리와 유사도가 가장 높은 소리모델을 해당 분할구간의 소리모델로 설정하는 제2단계, 및 상기 오디오자료 혹은 영상물을 상기 소리모델별로 음향적 장면분할하는 제3단계를 포함한다.
Int. CL G10L 15/02 (2006.01)
CPC G10L 15/22(2013.01) G10L 15/22(2013.01) G10L 15/22(2013.01) G10L 15/22(2013.01)
출원번호/일자 1019990025031 (1999.06.28)
출원인 한국전자통신연구원
등록번호/일자 10-0348901-0000 (2002.08.02)
공개번호/일자 10-2001-0004400 (2001.01.15) 문서열기
공고번호/일자 (20020814) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 소멸
심사진행상태 수리
심판사항
구분
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2000.08.28)
심사청구항수 12

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전광역시 유성구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 최환진 대한민국 대전광역시유성구
2 박동인 대한민국 대전광역시유성구
3 박전규 대한민국 대전광역시유성구
4 이원일 대한민국 대전광역시서구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 전영일 대한민국 광주 북구 첨단과기로***번길**, ***호(오룡동)(특허법인세아 (광주분사무소))

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 한국전자통신연구원 대한민국 대전 유성구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 출원서
Patent Application
1999.06.28 수리 (Accepted) 1-1-1999-0069404-36
2 출원심사청구서
Request for Examination
2000.08.28 수리 (Accepted) 1-1-2000-0180152-90
3 명세서 등 보정서
Amendment to Description, etc.
2000.08.28 보정승인 (Acceptance of amendment) 1-1-2000-0180107-45
4 출원인정보변경(경정)신고서
Notification of change of applicant's information
2001.04.19 수리 (Accepted) 4-1-2001-0046046-20
5 등록결정서
Decision to grant
2002.05.28 발송처리완료 (Completion of Transmission) 9-5-2002-0182892-19
6 출원인정보변경(경정)신고서
Notification of change of applicant's information
2002.08.08 수리 (Accepted) 4-1-2002-0065009-76
7 출원인정보변경(경정)신고서
Notification of change of applicant's information
2009.08.04 수리 (Accepted) 4-1-2009-5150899-36
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2015.02.02 수리 (Accepted) 4-1-2015-0006137-44
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1

음향적 장면으로 분할하고자 하는 오디오자료 혹은 영상물에 등장하는 대상물(사람, 동물, 악기, 음향기기 등을 모두 지칭)이 내는 소리(대상물이 내는 모든 소리를 지칭)별로 소리모델을 생성하여 저장하는 제1단계와,

상기 오디오자료 혹은 영상물로부터 제공되는 임의의 소리의 시작부터 종료까지의 분할구간에서 상기 임의의 소리와 유사도가 가장 높은 소리모델을 해당 분할구간의 소리모델로 설정하는 제2단계, 및

상기 오디오자료 혹은 영상물을 상기 소리모델별로 음향적 장면분할하는 제3단계를 포함한 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

2 2

제1항에 있어서, 상기 제1단계는,

상기 대상물이 내는 소리들을 디지털 형태로 변환하는 제1소단계와,

각각의 소리에서 특징 파라미터를 추출하는 제2소단계,

상기 소리의 특징 파라미터를 음성인식에 사용되는 인식모델을 사용하여 모델링하는 제3소단계, 및

상기 각각의 소리에 대한 소리모델을 데이터베이스에 저장하는 제4소단계를 포함하는 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

3 3

제2항에 있어서, 상기 인식모델은 은닉 마르코프모델인 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

4 4

제2항에 있어서, 상기 인식모델은 동적정합모델인 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

5 5

제2항에 있어서, 상기 인식모델은 신경회로망인 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

6 6

제2항에 있어서, 상기 인식모델은 벡터양자화모델인 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

7 7

제2항에 있어서, 상기 인식모델은 음향-지식기반모델인 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

8 8

제2항에 있어서, 상기 소리모델은, 소리모델명, 성별, 대상물, 연령, 직업 등 소리모델이 가지는 여러 가지 속성들과 함께 저장되는 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

9 9

제1항에 있어서, 상기 제2단계는,

상기 분할구간에서의 소리를 디지털 형태로 변환하는 제1소단계와,

상기 소리에서 특징 파라미터를 추출하는 제2소단계,

상기 분할구간의 소리 특징 파라미터와 소리모델을 정합하는 제3소단계, 및

정합도가 가장 큰 소리모델을 상기 분할구간의 소리모델로 설정하는 제4소단계를 포함하는 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

10 10

제9항에 있어서, 상기 제1소단계에서 상기 분할구간은 오디오자료의 분석 단위인 프레임단위로 이루어지는 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

11 11

제1항에 있어서, 상기 연결이 단절된 소리모델 구간(disconnected region)을 하나의 구간으로 연결하고, 지나치게 짧은 소리모델 구간은 삭제하며, 중첩된 소리모델 구간(overlapped region)은 소리모델별로 분리하는 등의 처리를 수행하는 후처리단계를 더 포함한 것을 특징으로 하는 오디오/영상물의 음향적 장면분할방법

12 12

컴퓨터에,

음향적 장면으로 분할하고자 하는 오디오자료 혹은 영상물에 등장하는 대상물(사람, 동물, 악기, 음향기기 등을 모두 지칭)이 내는 소리(대상물이 내는 모든 소리를 지칭)별로 소리모델을 생성하여 저장하는 제1단계와;

상기 오디오자료 혹은 영상물로부터 제공되는 임의의 소리의 시작부터 종료까지의 분할구간에서 상기 임의의 소리와 유사도가 가장 높은 소리모델을 해당 분할구간의 소리모델로 설정하는 제2단계;

상기 오디오자료 혹은 영상물을 상기 소리모델별로 음향적 장면분할하는 제3단계; 및

상기 음향적 장면분할단계 후, 연결이 단절된 소리모델 구간(disconnected region)을 하나의 구간으로 연결하고, 지나치게 짧은 소리모델 구간은 삭제하며, 중첩된 소리모델 구간(overlapped region)은 소리모델별로 분리하는 등의 처리를 수행하는 제4단계를 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체

지정국 정보가 없습니다
패밀리정보가 없습니다
국가 R&D 정보가 없습니다.