1 |
1
화자 음성 인증 서비스에서 스푸핑을 검출하는 음성 인증 시스템에 있어서, 제 1 화자의 정상 음성 신호 및 랜덤 노이즈 신호를 합성하여 학습용 합성 음성 신호 및 평가용 합성 음성 신호를 포함하는 상기 제 1 화자에 대한 복수의 합성 음성 신호를 생성하는 음성 합성부 및 상기 제 1 화자의 학습용 정상 음성 신호 또는 상기 학습용 합성 음성 신호를 상기 제 1 화자의 학습용 음성 신호로서 수신하고, 상기 제 1 화자의 학습용 음성 신호와 상기 제 1 화자의 정상 음성 신호를 비교하여, 상기 제 1 화자의 학습용 음성 신호의 합성 여부를 판별하는 음성 판별부를 포함하는 음성 합성 시스템; 및상기 제 1 화자의 학습용 음성 신호의 합성 여부에 대한 판별 결과에 기초하여 상기 화자 음성 인증 서비스를 제공하는 스푸핑 검출 시스템을 포함하는 음성 인증 시스템
|
2 |
2
제 1 항에 있어서,상기 음성 합성부는 적대적 생성 네트워크에 기초하여 상기 제 1 화자의 정상 음성 신호와 유사한 합성 음성 신호를 생성하기 위한 학습을 수행하고, 상기 음성 판별부는 상기 적대적 생성 네트워크에 기초하여 상기 제 1 화자의 학습용 음성 신호와 상기 제 1 화자의 정상 음성 신호를 구별하기 위한 학습을 수행하는 것인, 음성 인증 시스템
|
3 |
3
제 2 항에 있어서,상기 음성 합성부는 상기 적대적 생성 네트워크에 대한 목적 함수를 최소화하도록 학습하고, 상기 음성 판별부는 상기 목적 함수를 최대화하도록 학습하는 것인, 음성 인증 시스템
|
4 |
4
제 3 항에 있어서,상기 음성 합성부가 상기 목적 함수를 최소화하도록 상기 음성 합성부는 상기 제 1 화자의 학습용 음성 신호의 합성 여부에 대한 확률을 높이도록 학습하는 것인, 음성 인증 시스템
|
5 |
5
제 4 항에 있어서,상기 음성 판별부가 상기 목적 함수를 최대화하도록 상기 음성 판별부는 상기 제 1 화자의 학습용 음성 신호로서 상기 학습용 정상 음성 신호와 상기 학습용 합성 음성 신호의 구분에 대한 확률을 높이도록 학습하는 것인, 음성 인증 시스템
|
6 |
6
삭제
|
7 |
7
제 1 항에 있어서, 상기 음성 합성부 및 상기 음성 판별부는 조건부 적대적 생성 네트워크에 기초하여 학습을 수행하는 것인, 음성 인증 시스템
|
8 |
8
제 7 항에 있어서,상기 음성 합성부는 상기 제 1 화자의 정상 음성 신호에 대한 조건을 수신하고,상기 음성 판별부는 상기 제 1 화자의 학습용 음성 신호에 대한 조건을 수신하는 것인, 음성 인증 시스템
|
9 |
9
제 8 항에 있어서,상기 조건은 화자에 대한 정보 및 수신하는 음성 신호에 대한 텍스트 정보를 포함하는 것인, 음성 인증 시스템
|
10 |
10
제 1 항에 있어서, 상기 스푸핑 검출 시스템은 상기 제 1 화자의 학습용 음성 신호를 수신하고, 상기 수신된 제 1 화자의 학습용 음성 신호에 대한 스푸핑 여부를 검출하는 학습을 수행하는 것인, 음성 인증 시스템
|
11 |
11
제 1 항에 있어서, 상기 스푸핑 검출 시스템이 상기 평가용 합성 음성 신호를 합성된 음성 신호로 판단한 경우, 상기 음성 합성부는 상기 제 1 화자의 정상 음성 신호와 유사한 합성 음성 신호를 재생성하도록 학습하는 것인, 음성 인증 시스템
|
12 |
12
제 11 항에 있어서,상기 스푸핑 검출 시스템이 평가용 정상 음성 신호 중 적어도 하나의 평가용 정상 음성 신호를 합성된 음성 신호로 판단한 경우, 상기 스푸핑 검출 시스템은 상기 합성된 음성 신호로 판단된 적어도 하나의 평가용 정상 음성 신호를 상기 제 1 화자의 정상 음성 신호로 인식하도록 재학습을 수행하는 것인, 음성 인증 시스템
|
13 |
13
제 11 항에 있어서,상기 스푸핑 검출 시스템이 상기 평가용 합성 음성 신호 중 적어도 하나의 평가용 합성 음성 신호를 상기 제 1 화자의 정상 음성 신호로 판단한 경우, 상기 스푸핑 검출 시스템은 상기 제 1 화자의 정상 음성 신호로 판단된 적어도 하나의 평가용 합성 음성 신호를 상기 제 1 화자의 정상 음성 신호와 구별하도록 하는 재학습을 수행하는 것인, 음성 인증 시스템
|
14 |
14
화자 음성 인증 서비스를 제공하는 스푸핑 검출 시스템에서 이용되는 화자의 음성을 합성하는 음성 합성 시스템에 있어서,제 1 화자의 정상 음성 신호 및 랜덤 노이즈 신호를 합성하여 학습용 합성 음성 신호 및 평가용 합성 음성 신호를 포함하는 상기 제 1 화자에 대한 복수의 합성 음성 신호를 생성하는 음성 합성부; 및상기 제 1 화자의 학습용 정상 음성 신호 또는 상기 학습용 합성 음성 신호를 상기 제 1 화자의 학습용 음성 신호로서 수신하고, 상기 제 1 화자의 학습용 음성 신호와 상기 제 1 화자의 정상 음성 신호를 비교하여, 상기 제 1 화자의 학습용 음성 신호의 합성 여부를 판별하는 음성 판별부를 포함하는 음성 합성 시스템
|