맞춤기술찾기

이전대상기술

하이브리드 오디오 핑거프린팅 장치 및 방법

  • 기술번호 : KST2019011700
  • 담당센터 : 서울서부기술혁신센터
  • 전화번호 : 02-6124-6930
요약, Int. CL, CPC, 출원번호/일자, 출원인, 등록번호/일자, 공개번호/일자, 공고번호/일자, 국제출원번호/일자, 국제공개번호/일자, 우선권정보, 법적상태, 심사진행상태, 심판사항, 구분, 원출원번호/일자, 관련 출원번호, 기술이전 희망, 심사청구여부/일자, 심사청구항수의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 서지정보 표입니다.
요약 하이브리드 오디오 핑거프린팅 장치 및 방법을 공개한다. 본 발명은 MCLT를 이용하여, 쿼리 오디오 신호를 시간-주파수 축의 MCLT 스펙트럼으로 변환하고, 변환된 MCLT 스펙트럼을 포어그라운드 스펙트럼과 백그라운드 스펙트럼으로 분리하며, 포어그라운드 스펙트럼으로부터 PT-기반 오디오 핑거프린트를 추출하고, MCLT 스펙트럼과 백그라운드 스펙트럼으로부터 PP-기반 오디오 핑거프린트를 추출하여 멀티 오디오 핑거프린트를 획득하는 오디오 핑거프린트 추출부 및 PT-기반 오디오 핑거프린트 및 PP-기반 오디오 핑거프린트 각각의 해시 정보를 획득하고, 해시 정보를 기반으로 PT-기반 오디오 핑거프린트 및 PP-기반 오디오 핑거프린트 각각을 기저장된 오디오 정보와 비교하여 PT 및 PP 검색 후보를 선정하고, 선정된 PT 및 PP 검색 후보로부터 최종 검색 결과를 선택하여 출력하는 오디오 핑거프린트 검색부를 포함한다.
Int. CL G06F 16/00 (2019.01.01) G10L 19/02 (2006.01.01)
CPC G06F 16/683(2013.01) G06F 16/683(2013.01) G06F 16/683(2013.01) G06F 16/683(2013.01)
출원번호/일자 1020150163471 (2015.11.20)
출원인 광운대학교 산학협력단, 서울대학교산학협력단
등록번호/일자 10-1661666-0000 (2016.09.26)
공개번호/일자
공고번호/일자 (20160930) 문서열기
국제출원번호/일자
국제공개번호/일자
우선권정보
법적상태 등록
심사진행상태 수리
심판사항
구분 신규
원출원번호/일자
관련 출원번호
심사청구여부/일자 Y (2015.11.20)
심사청구항수 16

출원인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 출원인 표입니다.
번호 이름 국적 주소
1 광운대학교 산학협력단 대한민국 서울특별시 노원구
2 서울대학교산학협력단 대한민국 서울특별시 관악구

발명자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 발명자 표입니다.
번호 이름 국적 주소
1 김형국 대한민국 서울특별시 동대문구
2 조혜승 대한민국 서울특별시 노원구
3 한경복 중국 서울특별시 노원구

대리인

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 대리인 표입니다.
번호 이름 국적 주소
1 특허법인우인 대한민국 서울특별시 강남구 역삼로 ***, *층(역삼동, 중평빌딩)

최종권리자

번호, 이름, 국적, 주소의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 인명정보 - 최종권리자 표입니다.
번호 이름 국적 주소
1 광운대학교 산학협력단 대한민국 서울특별시 노원구
2 서울대학교산학협력단 대한민국 서울특별시 관악구
번호, 서류명, 접수/발송일자, 처리상태, 접수/발송일자의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 행정처리 표입니다.
번호 서류명 접수/발송일자 처리상태 접수/발송번호
1 [특허출원]특허출원서
[Patent Application] Patent Application
2015.11.20 수리 (Accepted) 1-1-2015-1135761-93
2 [출원인변경]권리관계변경신고서
[Change of Applicant] Report on Change of Proprietary Status
2015.12.24 수리 (Accepted) 1-1-2015-1271894-13
3 출원인정보변경(경정)신고서
Notification of change of applicant's information
2016.05.09 수리 (Accepted) 4-1-2016-5056854-41
4 의견제출통지서
Notification of reason for refusal
2016.06.23 발송처리완료 (Completion of Transmission) 9-5-2016-0456537-14
5 [명세서등 보정]보정서
[Amendment to Description, etc.] Amendment
2016.06.24 보정승인간주 (Regarded as an acceptance of amendment) 1-1-2016-0612512-53
6 [거절이유 등 통지에 따른 의견]의견(답변, 소명)서
[Opinion according to the Notification of Reasons for Refusal] Written Opinion(Written Reply, Written Substantiation)
2016.06.24 수리 (Accepted) 1-1-2016-0612492-27
7 등록결정서
Decision to grant
2016.08.01 발송처리완료 (Completion of Transmission) 9-5-2016-0551881-67
8 출원인정보변경(경정)신고서
Notification of change of applicant's information
2017.03.27 수리 (Accepted) 4-1-2017-5046666-19
9 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.13 수리 (Accepted) 4-1-2019-5093546-10
10 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.05.23 수리 (Accepted) 4-1-2019-5101798-31
11 출원인정보변경(경정)신고서
Notification of change of applicant's information
2019.08.02 수리 (Accepted) 4-1-2019-5154561-59
12 출원인정보변경(경정)신고서
Notification of change of applicant's information
2020.11.25 수리 (Accepted) 4-1-2020-5265458-48
번호, 청구항의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 청구항 표입니다.
번호 청구항
1 1
MCLT(Modulated complex lapped transform)를 이용하여, 쿼리 오디오 신호를 시간-주파수 축의 MCLT 스펙트럼으로 변환하고, 변환된 상기 MCLT 스펙트럼을 포어그라운드 스펙트럼과 백그라운드 스펙트럼으로 분리하며, 상기 포어그라운드 스펙트럼으로부터 PT(Peak triplet)-기반 오디오 핑거프린트를 추출하고, 상기 MCLT 스펙트럼과 상기 백그라운드 스펙트럼으로부터 PP(Prominent pitch)-기반 오디오 핑거프린트를 추출하여 멀티 오디오 핑거프린트를 획득하는 오디오 핑거프린트 추출부; 및 상기 PT-기반 오디오 핑거프린트 및 PP-기반 오디오 핑거프린트 각각의 해시 정보를 획득하고, 해시 정보를 기반으로 PT-기반 오디오 핑거프린트 및 PP-기반 오디오 핑거프린트 각각을 기저장된 오디오 정보와 비교하여 PT 및 PP 검색 후보를 선정하고, 선정된 PT 및 PP 검색 후보로부터 최종 검색 결과를 선택하여 출력하는 오디오 핑거프린트 검색부; 를 포함하는 하이브리드 오디오 핑거프린팅 장치
2 2
제1 항에 있어서, 상기 오디오 핑거프린트 추출부는 검색하고자 하는 음악 신호가 포함된 상기 쿼리 오디오 신호를 획득하는 쿼리 오디오 입력부; 상기 쿼리 오디오 신호에 상기 MCLT를 적용하여 상기 MCLT 스펙트럼을 획득하는 MCLT 변환부; 상기 MCLT 스펙트럼으로부터 상기 음악 신호와 잡음을 분리하기 위해, 동일 신호 성분이 반복되는 상기 백그라운드 스펙트럼과 반복되지 않는 상기 포어그라운드 스펙트럼으로 분리하는 스펙트럼 분리부; 및 상기 포어그라운드 스펙트럼의 피크를 추출하여 PT(Peak triplet)를 결정하고, 결정된 상기 PT의 해시 정보를 이용하여 상기 PT-기반 오디오 핑거프린트를 생성하며, 상기 MCLT 스펙트럼과 상기 백그라운드 스펙트럼의 값을 비교하고, 비교 결과에 따라 스펙트럼 위치별 바이너리 값을 할당하여 상기 PP-기반 오디오 핑거프린트를 생성하는 멀티 핑거프린트 추출부; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
3 3
제2 항에 있어서, 상기 오디오 핑거프린트 추출부는 상기 스펙트럼 분리부에서 상기 쿼리 오디오 신호의 초기 기설정된 시간동안 분리된 상기 포어그라운드 스펙트럼과 상기 백그라운드 스펙트럼을 이용하여 FBR(Foreground-to-Background Ratio)을 계산하고, 계산된 상기 FBR에 대응하여, 상기 쿼리 오디오 신호의 길이를 조절하는 쿼리 오디오 길이 설정부; 를 더 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
4 4
제3 항에 있어서, 상기 멀티 핑거프린트 추출부는 상기 포어그라운드 스펙트럼을 인가받아 기설정된 전처리 작업을 수행하고, 전처리된 상기 포어그라운드 스펙트럼을 기설정된 방식으로 획득되는 PT 문턱값과 비교하여 HP(high peaks)를 획득하며, 획득된 상기 HP를 기반으로 상기 PT를 결정하고, 결정된 상기 PT의 상기 해시 정보를 획득하여 상기 PT-기반 오디오 핑거프린트를 생성하는 PT 핑거프린트 추출부; 및 상기 MCLT 스펙트럼을 분석하여 이득값 파라미터를 계산하고, 상기 이득값 파라미터를 적용하여 상기 백그라운드 스펙트럼을 갱신하며, 상기 MCLT 스펙트럼과 갱신된 상기 백그라운드 스펙트럼의 값을 비교하여 상기 MCLT 스펙트럼 상의 각 위치별 바이너리 값을 할당하여 상기 PP-기반 오디오 핑거프린트를 생성하는 PP 핑거프린트 추출부; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
5 5
제4 항에 있어서, 상기 PT 핑거프린트 추출부는 상기 포어그라운드 스펙트럼에 로그를 취해 로그 도메인으로 변환한 다음, 영점 정규화하여 상기 전처리 작업을 수행하고, 전처리된 상기 포어그라운드 스펙트럼의 초기 기설정된 개수의 프레임에서 각 주파수 빈에 대해 가장 큰 값을 가지는 값들을 선별하여 상기 PT 문턱값의 초기값을 생성하며, 획득된 상기 HP에 지수 함수를 적용하여 상기 PT 문턱값을 갱신하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
6 6
제5 항에 있어서, 상기 PT 핑거프린트 추출부는 획득된 상기 HP를 앵커 피크로 설정하여, 타겟존을 설정하고, 상기 앵커 피크를 기준으로 타겟 존 내에서 앵커 피크와 인접한 두 개의 피크(인접 피크1, 인접 피크2)를 선택하여 상기 PT를 결정하고, 상기 PT로부터 상기 앵커 피크의 주파수 축 위치, 상기 앵커 피크와 상기 인접 피크1 간의 주파수 축 거리 차이, 상기 인접 피크1과 상기 인접 피크2 간의 주파수 축 거리차이, 상기 앵커 피크와 상기 인접 피크1 간의 시간 축 거리차이와 상기 앵커 피크와 상기 인접 피크2 간의 시간 축 거리 차이의 비로 구성되는 상기 해시 정보를 PT-기반의 오디오 핑거프린트 정보로서 생성하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
7 7
제6 항에 있어서, 상기 오디오 핑거프린트 검색부는 상기 해시 정보와 상기 해시 정보에 대응하는 오디오 ID 를 포함하는 오디오 정보를 저장하는 오디오 정보 저장부; 상기 PT-기반 오디오 핑거프린트와 상기 PP-기반 오디오 핑거프린트를 인가받아 해시 주소와 해시 값을 포함하는 상기 해시 정보를 생성하여 상기 오디오 정보 저장부에 저장하는 해시 생성부; 상기 해시 주소를 기반으로 상기 오디오 정보 저장부의 해시 테이블에서 상기 PT-기반 오디오 핑거프린트에 매칭되는 상기 PT 검색 후보 및 상기 PP-기반 오디오 핑거프린트에 매칭되는 상기 PP 검색 후보를 탐색하여 출력하는 멀티 오디오 핑거프린트 검색부; 및 상기 PT 검색 후보와 상기 PP 검색 후보를 인가받아, 검색 빈도가 가장 높은 검색 후보에 대응하는 오디오 ID를 최종 검색 결과로 선택하고, 상기 최종 검색 결과에 대응하는 오디오 정보를 상기 오디오 정보 저장부에서 획득하여 출력하는 하이브리드 결과 분석부; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
8 8
제7 항에 있어서, 상기 멀티 오디오 핑거프린트 검색부는 상기 오디오 정보 저장부에서 상기 해시 테이블에 저장된 PT-기반 오디오 핑거프린트의 해시 주소와 매칭되는 해시 값으로부터 오디오 ID를 획득하고, 획득된 오디오 ID 중 검색빈도가 많은 상위 기설정된 범위의 상기 오디오 ID를 매칭 후보군으로 선별하며, 상기 매칭 후보군의 상기 PT-기반의 오디오 핑거프린트 정보인 상기 해시 정보를 이용하여 피크 히스토그램을 생성하고, 생성된 상기 매칭 후보군 각각의 피크 히스토그램과 검색 대상 오디오 신호의 피크 히스토그램을 매칭하여, 상기 PT 검색 후보를 선정하는 PT 기반 검색부; 및 상기 오디오 정보 저장부에서 상기 해시 테이블에 저장된 PP-기반 오디오 핑거프린트의 해시 주소와 상기 해시 주소에 대응하는 PP-기반 오디오 핑거프린트를 획득하고, 상기 해시 주소에 대응하는 PP-기반 오디오 핑거프린트와 상기 PP 핑거프린트 추출부에서 생성된 PP-기반 오디오 핑거프린트를 비교하여 동일 크기의 블록을 탐색하며, 탐색된 상기 블록에서 PP-기반 오디오 핑거프린트들 사이의 비트 에러를 계산하여 상기 PP 검색 후보를 선정하는 PP 기반 검색부; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 장치
9 9
오디오 핑거프린트 추출부 및 오디오 핑거프린트 검색부를 구비하는 하이브리드 오디오 핑거프린팅 장치의 하이브리드 오디오 핑거프린팅 방법에 있어서, 상기 오디오 핑거프린트 추출부가 MCLT(Modulated complex lapped transform)를 이용하여, 쿼리 오디오 신호를 시간-주파수 축의 MCLT 스펙트럼으로 변환하는 단계; 상기 오디오 핑거프린트 추출부가 변환된 상기 MCLT 스펙트럼으로부터 음악 신호와 잡음을 분리하기 위해, 동일 신호 성분이 반복되는 백그라운드 스펙트럼과 반복되지 않는 포어그라운드 스펙트럼으로 분리하는 단계; 상기 오디오 핑거프린트 추출부가 상기 포어그라운드 스펙트럼의 피크를 추출하여 PT(Peak triplet)를 결정하고, 결정된 상기 PT의 해시 정보를 이용하여 PT-기반 오디오 핑거프린트를 생성하는 단계; 및 상기 오디오 핑거프린트 추출부가 상기 MCLT 스펙트럼과 상기 백그라운드 스펙트럼의 값을 비교하고, 비교 결과에 따라 스펙트럼 위치별 바이너리 값을 할당하여 PP-기반 오디오 핑거프린트를 생성하는 단계; 를 포함하는 하이브리드 오디오 핑거프린팅 방법
10 10
제9 항에 있어서, 상기 PT-기반 오디오 핑거프린트를 생성하는 단계는 상기 포어그라운드 스펙트럼에 로그를 취해 로그 도메인으로 변환하고, 영점 정규화하여 전처리 작업을 수행하는 단계; 전처리된 상기 포어그라운드 스펙트럼의 초기 기설정된 개수의 프레임에서 각 주파수 빈에 대해 가장 큰 값을 가지는 값들을 선별하여 PT 문턱값의 초기값을 생성하는 단계; 전처리된 상기 포어그라운드 스펙트럼을 상기 PT 문턱값과 비교하여 HP(high peaks)를 획득하는 단계; 획득된 상기 HP를 기반으로 상기 PT를 결정하는 단계; 결정된 상기 PT의 상기 해시 정보를 획득하고, 획득된 상기 해시 정보를 상기 PT-기반 오디오 핑거프린트로 설정하는 단계; 및 획득된 상기 HP에 지수 함수를 적용하여 상기 PT 문턱값을 갱신하는 단계; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
11 11
제10 항에 있어서, 상기 PP-기반 오디오 핑거프린트를 생성하는 단계는 상기 MCLT 스펙트럼을 분석하여 이득값 파라미터를 계산하는 단계; 상기 이득값 파라미터를 적용하여 상기 백그라운드 스펙트럼을 갱신하는 단계; 상기 MCLT 스펙트럼과 갱신된 상기 백그라운드 스펙트럼의 값을 비교하는 단계; 및 상기 비교 결과에 따라, 상기 MCLT 스펙트럼 상의 각 위치별 바이너리 값을 할당하여 상기 PP-기반 오디오 핑거프린트를 획득하는 단계; 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
12 12
제9 항에 있어서, 상기 하이브리드 오디오 핑거프린팅 방법은 상기 포어그라운드 스펙트럼으로 분리하는 단계 이후, 상기 쿼리 오디오 신호의 초기 기설정된 시간동안 분리된 상기 포어그라운드 스펙트럼과 상기 백그라운드 스펙트럼을 이용하여 FBR(Foreground-to-Background Ratio)을 계산하는 단계; 및 계산된 상기 FBR에 대응하여, 상기 쿼리 오디오 신호의 길이를 조절하는 단계; 를 더 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
13 13
제9 항에 있어서, 상기 하이브리드 오디오 핑거프린팅 방법은 상기 오디오 핑거프린트 검색부가 상기 PT-기반 오디오 핑거프린트와 상기 PP-기반 오디오 핑거프린트 각각에 대한 해시 정보를 생성하고, 생성된 해시 정보를 기저장된 오디오 정보에 대한 해시 정보와 비교하여 PT 검색 후보 및 PP 검색 후보를 획득하는 단계; 및 상기 오디오 핑거프린트 검색부가 상기 PT 검색 후보 및 상기 PP 검색 후보로부터 최종 검색 결과를 선택하여 출력하는 단계; 를 더 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
14 14
제13 항에 있어서, 상기 검색 후보를 획득하는 단계는 상기 PT-기반 오디오 핑거프린트와 상기 PP-기반 오디오 핑거프린트를 인가받아 해시 주소와 해시 값을 포함하는 상기 해시 정보를 생성하는 단계; 상기 해시 주소를 기반으로 상기 오디오 핑거프린트 검색부의 해시 테이블에서 상기 PT-기반 오디오 핑거프린트에 매칭되는 상기 PT 검색 후보를 탐색하는 단계; 및 상기 오디오 핑거프린트 검색부에 기저장된 상기 해시 주소와 PP-기반 오디오 핑거프린트를 획득하고, 획득된 상기 PP-기반 오디오 핑거프린트에 매칭되는 상기 PP 검색 후보를 탐색하는 단계; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
15 15
제14 항에 있어서, 상기 PT 검색 후보를 탐색하는 단계는 상기 오디오 핑거프린트 검색부의 상기 해시 테이블에 기저장된 PT-기반 오디오 핑거프린트의 해시 주소에 대응하는 해시 값으로부터 오디오 ID를 획득하는 단계; 획득된 오디오 ID 중 검색빈도가 많은 상위 기설정된 범위의 상기 오디오 ID를 매칭 후보군으로 선별하는 단계; 상기 매칭 후보군의 상기 PT-기반의 오디오 핑거프린트 정보인 상기 해시 정보를 이용하여 피크 히스토그램을 생성하는 단계; 및 생성된 상기 매칭 후보군 각각의 피크 히스토그램과 검색 대상 오디오 신호의 피크 히스토그램을 매칭하여 상기 PT 검색 후보를 선정하는 단계; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
16 16
제15 항에 있어서, 상기 PP 검색 후보를 탐색하는 단계는 상기 해시 테이블에 저장된 PP-기반 오디오 핑거프린트의 해시 주소와 상기 해시 주소에 대응하는 PP-기반 오디오 핑거프린트를 획득하는 단계; 상기 해시 주소에 대응하는 PP-기반 오디오 핑거프린트와 상기 PP-기반 오디오 핑거프린트를 생성하는 단계에서 생성된 PP-기반 오디오 핑거프린트를 비교하여 동일 크기의 블록을 탐색하는 단계; 탐색된 상기 블록에서 PP-기반 오디오 핑거프린트들 사이의 비트 에러를 계산하는 단계; 및 상기 비트 에러가 기설정된 비트 에러 문턱값 이하이면, 상기 PP 검색 후보로 선정하는 단계; 를 포함하는 것을 특징으로 하는 하이브리드 오디오 핑거프린팅 방법
지정국 정보가 없습니다
패밀리정보가 없습니다
순번, 연구부처, 주관기관, 연구사업, 연구과제의 정보를 제공하는 이전대상기술 뷰 페이지 상세정보 > 국가R&D 연구정보 정보 표입니다.
순번 연구부처 주관기관 연구사업 연구과제
1 미래창조과학부 서울대학교 산학협력단 대학 ICT 연구센터 육성지원사업 실감 오케스트라 서비스를 위한 입체음향 취득/재현기술 개발