1 |
1
판소리 음원을 입력받아 구조를 분석하여 장단과 마디를 예측하는 구조 분석부;상기 구조 분석을 통해 상기 판소리 음원의 소리 부분을 부호화하고 채보하는 소리부분 채보부를 포함하고,상기 구조 분석부는, 상기 판소리 음원의 피치(pitch) 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients)의 특징을 추출하는 특징추출부; 상기 피치 정보의 유무에 따라 음성구간과 비음성구간을 구별하는 소리분별부; 상기 판소리 음원으로부터 전문가를 통해 분별된 합과 궁의 위치에서 15차원 벡터 열 형태의 윈도우 템플릿을 구성하여 장단을 구별하는 장단분별부; 상기 합과 궁의 주기가 가우시언(Gaussian) 분포를 가진다고 가정하고 선형 칼만 필터를 통해 상기 장단의 합과 궁으로 관측된 마디위치를 평활화시켜 마디를 추정하는 마디예측부를 포함하며,상기 MFCC의 특징은,주파수 분포 중에서 특정 부분을 포착하는 것으로, 13차원 벡터로 표현되는 것을 특징으로 하는 판소리 자동 채보 장치
|
2 |
2
삭제
|
3 |
3
삭제
|
4 |
4
삭제
|
5 |
5
삭제
|
6 |
6
판소리 음원을 입력받아 구조를 분석하여 장단과 마디를 예측하는 구조 분석부;상기 구조 분석을 통해 상기 판소리 음원의 소리 부분을 부호화하고 채보하는 소리부분 채보부를 포함하고,상기 구조 분석부는, 상기 판소리 음원의 피치(pitch) 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients)의 특징을 추출하는 특징추출부; 상기 피치 정보의 유무에 따라 음성구간과 비음성구간을 구별하는 소리분별부; 상기 판소리 음원으로부터 전문가를 통해 분별된 합과 궁의 위치에서 15차원 벡터 열 형태의 윈도우 템플릿을 구성하여 장단을 구별하는 장단분별부; 상기 합과 궁의 주기가 가우시언(Gaussian) 분포를 가진다고 가정하고 선형 칼만 필터를 통해 상기 장단의 합과 궁으로 관측된 마디위치를 평활화시켜 마디를 추정하는 마디예측부를 포함하며,상기 소리분별부는, 상기 판소리 음원 내의 피치 정보 유무에 따라 음성구간과 비음성구간을 분할한 후, 현재 비음성구간의 길이가 0
|
7 |
7
판소리 음원을 입력받아 구조를 분석하여 장단과 마디를 예측하는 구조 분석부;상기 구조 분석을 통해 상기 판소리 음원의 소리 부분을 부호화하고 채보하는 소리부분 채보부를 포함하고,상기 구조 분석부는, 상기 판소리 음원의 피치(pitch) 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients)의 특징을 추출하는 특징추출부; 상기 피치 정보의 유무에 따라 음성구간과 비음성구간을 구별하는 소리분별부; 상기 판소리 음원으로부터 전문가를 통해 분별된 합과 궁의 위치에서 15차원 벡터 열 형태의 윈도우 템플릿을 구성하여 장단을 구별하는 장단분별부; 상기 합과 궁의 주기가 가우시언(Gaussian) 분포를 가진다고 가정하고 선형 칼만 필터를 통해 상기 장단의 합과 궁으로 관측된 마디위치를 평활화시켜 마디를 추정하는 마디예측부를 포함하며,상기 장단분별부는, 윈도우 템플릿의 크기를 다르게 하여 합 위치 부근에서 NCC(Normalized Cross Correlation;정규화된 상호연관성)를 구하고 국부 최대치 부분을 찾아 합 또는 궁의 위치라고 가정할 때, 이들 위치들에서 NCC 값의 평균을 최대로 하는 윈도우 템플릿의 지속시간을 장단별 윈도우 템플릿의 지속시간으로 간주하고, 합 또는 궁 주변에서 국부 최대치를 갖는 부분을 구하는 NLMS(Non-Local Maxima Suppression) 과정을 거쳐, 가장 높은 NCC 값을 제공하는 장단에 투표를 하여 소리 구간 전체에 대해 가장 많이 득표를 한 장단을 해당 장단으로 판별하는 것을 특징으로 하는 판소리 자동 채보 장치
|
8 |
8
삭제
|
9 |
9
판소리 음원을 입력받아 구조를 분석하여 장단과 마디를 예측하는 구조 분석부;상기 구조 분석을 통해 상기 판소리 음원의 소리 부분을 부호화하고 채보하는 소리부분 채보부를 포함하고,상기 구조 분석부는, 상기 판소리 음원의 피치(pitch) 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients)의 특징을 추출하는 특징추출부; 상기 피치 정보의 유무에 따라 음성구간과 비음성구간을 구별하는 소리분별부; 상기 판소리 음원으로부터 전문가를 통해 분별된 합과 궁의 위치에서 15차원 벡터 열 형태의 윈도우 템플릿을 구성하여 장단을 구별하는 장단분별부; 상기 합과 궁의 주기가 가우시언(Gaussian) 분포를 가진다고 가정하고 선형 칼만 필터를 통해 상기 장단의 합과 궁으로 관측된 마디위치를 평활화시켜 마디를 추정하는 마디예측부를 포함하며,상기 소리부분 채보부는, 상기 마디예측부에서 추정한 마디를 통해 마디가 지속되는 기간으로 소리의 템포를 알고 해당 소리의 장단을 기준으로 음길이를 산정하며 상기 소리 부분에서 음성구간과 비음성구간을 구분하고 비음성구간은 쉼표로, 음성 구간은 IOI(Inter Onset Interval;동일 온셋 구간)들을 분할하여 산정된 음 길이에 따라 음길이 부호를 결정하는 음길이부호부; IOI들의 피치값을 표준 주파수 테이블과 비교하여 코드를 산정하고 해당 코드의 주파수에 따라 음높이를 상대음정으로 부호화하는 음높이 및 길이 부호부를 포함하고,상기 음높이 및 길이부호부는, 상기 소리 부분으로부터 AMDF(Average Magnitude Difference Function) 함수를 이용하여 피치를 추출하는 피치추출부;TV 필터를 통해 상기 피치 정보를 평활화시키는 피치평활화부; 상기 피치 정보를 음성구간과 비음성구간으로 구분하고 상기 음성구간에서 음정이 동일하게 유지되는 IOI를 추출하는 피치분할부;상기 피치 정보에 따라 노래의 건(key)을 무시하고 다장조를 기준으로 모든 음을 부호화하는 음높이부호화부를 포함하는 판소리 자동 채보 장치
|
10 |
10
판소리 음원을 입력받아 구조를 분석하여 장단과 마디를 예측하는 구조 분석부;상기 구조 분석을 통해 상기 판소리 음원의 소리 부분을 부호화하고 채보하는 소리부분 채보부를 포함하고,상기 구조 분석부는, 상기 판소리 음원의 피치(pitch) 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients)의 특징을 추출하는 특징추출부; 상기 피치 정보의 유무에 따라 음성구간과 비음성구간을 구별하는 소리분별부; 상기 판소리 음원으로부터 전문가를 통해 분별된 합과 궁의 위치에서 15차원 벡터 열 형태의 윈도우 템플릿을 구성하여 장단을 구별하는 장단분별부; 상기 합과 궁의 주기가 가우시언(Gaussian) 분포를 가진다고 가정하고 선형 칼만 필터를 통해 상기 장단의 합과 궁으로 관측된 마디위치를 평활화시켜 마디를 추정하는 마디예측부를 포함하며,상기 소리부분 채보부는, 상기 마디예측부에서 추정한 마디를 통해 마디가 지속되는 기간으로 소리의 템포를 알고 해당 소리의 장단을 기준으로 음길이를 산정하며 상기 소리 부분에서 음성구간과 비음성구간을 구분하고 비음성구간은 쉼표로, 음성 구간은 IOI(Inter Onset Interval;동일 온셋 구간)들을 분할하여 산정된 음 길이에 따라 음길이 부호를 결정하는 음길이부호부; IOI들의 피치값을 표준 주파수 테이블과 비교하여 코드를 산정하고 해당 코드의 주파수에 따라 음높이를 상대음정으로 부호화하는 음높이 및 길이 부호부를 포함하고,상기 음길이부호부는, 장단과 마디 지속시간 정보를 통해 마디마다 음 길이에 해당하는 음 지속 시간을 구하는 음길이산정부;상기 IOI와 음 길이 사이의 오차를 고려하여 임시로 부여된 음표의 길이를 조정하고, 모든 조합의 가능성을 고려하되 탐색공간을 줄이기 위해 임시로 부여된 음표의 길이에 최대 한 단계 음표 차이를 두고 탐색 음표조합을 구성한 후, 모드 음표 조합의 길이가 박자수와 일치하는 것을 찾아내고 마디 내 모든 IOI와 해당 음표의 길이 사이의 절대오차의 합이 최소로 되는 음표조합을 찾아 음길이를 부호화하는 음길이보정부를 포함하는 판소리 자동 채보 장치
|
11 |
11
판소리 음원을 입력받아 훈련 집합과 검증 집합으로 나누는 단계; 상기 판소리 음원의 피치 정보, 에너지 및 MFCC(Mel-Frequency Cepstral Coefficients) 특징을 추출하는 단계; 상기 피치 정보를 통해 판소리 음원의 음성구간과 비음성구간을 나누어 소리의 구간을 분별하는 단계; 상기 훈련 집합에 속해 있는 상기 판소리 음원의 소리 구간에서 장단을 분별하는 단계; 상기 장단에 따른 합의 위치를 예상하고 합과 합 사이를 마디로 예측하는 단계; 상기 음성구간의 IOI(Inter Onset Interval;동일 온셋 구간)들의 피치 정보에 따라 음높이를 부호화하는 단계; 상기 장단과 상기 마디의 지속 시간을 통해 마디마다 음길이를 환산하고 음길이를 부호화하는 단계를 포함하는 판소리 자동 채보 방법
|
12 |
12
청구항 11에 있어서,상기 장단을 분별하는 단계는, 윈도우 템플릿의 크기를 다르게 하여 합 위치 부근에서 NCC(Normalized Cross Correlation;정규화된 상호연관성)를 구하고 국부 최대치 부분을 찾아 합 또는 궁의 위치라고 가정할 때, 이들 위치들에서 NCC 값의 평균을 최대로 하는 윈도우 템플릿의 지속시간을 장단별 윈도우 템플릿의 지속시간으로 간주하고, 합 또는 궁 주변에서 국부 최대치를 갖는 부분을 구하는 NLMS(Non-Local Maxima Suppression) 과정을 거쳐, 가장 높은 NCC 값을 제공하는 장단에 투표를 하여 소리 구간 전체에 대해 가장 많이 득표를 한 장단을 해당 장단으로 판별하는 것을 특징으로 하는 판소리 자동 채보 방법
|
13 |
13
청구항 11에 있어서,상기 마디의 예측은,선형 칼만 필터(Kalman filter)를 통해 장단의 합과 궁의 관측된 마디위치를 평활화함으로써 마디를 예측하는 것을 특징으로 하는 판소리 자동 채보 방법
|